Forum Main Page > Java Básico

Como fazer um web crawler

Goto page 1

New Topic    Reply Message
  1. Comment Arrow




  1. Sink0
    Offline
    Posts: 30

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    Eu gostaria de desenvolver um web crawler que ficasse estatico em um site apertando botoes, escrevendo e caixa de texto e lendo informacoes do site. Isso é possivel? E nao nao é para roubar senhas. O objetivo é desenvolver um porgram que opere em um homebroker sozinho. Obrigado




  1. hafonso
    Offline
    Posts: 51

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    ja fiz isso para pegar combos de cartas de magic...

    é um trabalho braçal vc tem e usar algo como o apache httpclient http://hc.apache.org/httpclient-3.x/ e tem que fazer tudo na mão localizar a informação no resultado naum da para usar XML pq naum é garantia que o xml vai estar tudo ok, então acho melhor usar regexp vou colocar aki o código que fiz para buscar combos.



    qualquer coisa estou ai.
    _________________
    Hudson Afonso
    Consultor 0 NetWeaver

    Interests:
    Ajax, WebWork, Flex, Emerging Technologies, Enterprise Portal (EP), Enterprise SOA, Java Programming, JavaScript, Knowledge Management (KM), Mobile, SAP Exchange Infrastructure (XI), SAP xApps, Scripting Languages, Standards, Visual Composer, Web Dynpro

    Pense Inteligente:
    A Inteligente é uma consultoria em tecnologia da informação, que atua na comercialização e implementação de produtos de software corporativos. Com foco no cliente, compreendemos a necessidade de nossos clientes e adicionamos valor para a condução de seus negócios.
    Focus:
    SPED, Saneamento de Cadastro, Saneamento de Dados, Cadastro de Clientes e Fornecedores, Cadastro da Receita Federal, CNPJ, CPF, Cadastro, Correção de Cadastro para o SPED, Exigências legais para o SPED, Cadastro CNPJ, Certidão CNPJ, Comprovante CPF, Consulta CPF, Consulta Serasa, Consulta SPC, Nota Fiscal Eletrônica, SPED Contábil, SPED Fiscal




  1. Sink0
    Offline
    Posts: 30

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    O que as linhas 60, 67 e 83 fazem? E o nome dos objetos vc pego no codigo fonte neh?




  1. staroski
    Offline
    Posts: 2087

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    Sink0:
    O que as linhas 60, 67 e 83 fazem?



    Adquira algum material sobre expressões regulares ou algum livro de Linguagens Formais ou de Compiladores para entender o que essas linhas estão fazendo.

    Te aconselho a começar a ler a especificação da API do Java. (Tem um link na assinatura dos meus posts)
    _________________
    Ricardo Artur Staroski
    Blumenau - SC

    Convenções de código Java

    Especificação das API's do Java:
    - Standard Edition (SE)
    - Enterprise Edition (EE)
    - Micro Edition (CLDC, MIDP, CDC, FP, PBP, PP)

    Visite também:
    - Totall Sistemas
    - Cechinel Tecnologia
    - Instituto YuDai de Culturas Orientais




  1. hafonso
    Offline
    Posts: 51

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    na linha 60 eu procuro por qualquer coisa parecida com <div class="Label" style="font-size: 11pt; font-style: italic;">Grim Harvest</div>

    na linha 67 e 68 eu pego o começo e o fim para eu isolar apenas o texto "Grim Harvest"

    na linha 83 eu busco por todos os cards na pagina e então mando imprimir cada card por combo.


    esse código ai era um plano para eu pegar a minha lista de cards e buscar combos para cada uma então eu iria cruzar as info para saber quantos combos eu ja tinha apenas com minha cartas velhas.
    _________________
    Hudson Afonso
    Consultor 0 NetWeaver

    Interests:
    Ajax, WebWork, Flex, Emerging Technologies, Enterprise Portal (EP), Enterprise SOA, Java Programming, JavaScript, Knowledge Management (KM), Mobile, SAP Exchange Infrastructure (XI), SAP xApps, Scripting Languages, Standards, Visual Composer, Web Dynpro

    Pense Inteligente:
    A Inteligente é uma consultoria em tecnologia da informação, que atua na comercialização e implementação de produtos de software corporativos. Com foco no cliente, compreendemos a necessidade de nossos clientes e adicionamos valor para a condução de seus negócios.
    Focus:
    SPED, Saneamento de Cadastro, Saneamento de Dados, Cadastro de Clientes e Fornecedores, Cadastro da Receita Federal, CNPJ, CPF, Cadastro, Correção de Cadastro para o SPED, Exigências legais para o SPED, Cadastro CNPJ, Certidão CNPJ, Comprovante CPF, Consulta CPF, Consulta Serasa, Consulta SPC, Nota Fiscal Eletrônica, SPED Contábil, SPED Fiscal




  1. Sink0
    Offline
    Posts: 30

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    Hafonso, eu acho que o que voce fez é exatamente o que eu preciso, so que meus conhecimentos em java nao me permitem entender o seu codigo. Voce poderia me dar alguma indicacao de onde eu posso procurar informacao para conseguir entende-lo? E se possivel voce poderia me dar uma geral qual a logica do seu codigo do tipo quais os passos que ele faz pra conseguir devinir os atributos dos abjetos do sites, fazer o requisito com o botao e tals? Caso isso seja trampo demais a sua ajuda ja valew bastante ae. Valew por todo ajuda ae.




  1. Sink0
    Offline
    Posts: 30

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    Caso outra pessoa com capacidade para abstrair o codigo e possa explica-lo no lugar do Afonso eu tambem estaria grato. O que eu preciso seria basicamente uma explicação da ordem logica de como as coisas contecem, e se possivel o que cada passagem ou grupo de passagens contribuem para tal. Obrigado por toda a ajuda.




  1. MauNunes
    Offline
    Posts: 115

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    staroski:

    Sink0:
    O que as linhas 60, 67 e 83 fazem?



    Adquira algum material sobre expressões regulares ou algum livro de Linguagens Formais ou de Compiladores para entender o que essas linhas estão fazendo.

    Te aconselho a começar a ler a especificação da API do Java. (Tem um link na assinatura dos meus posts)



    Calma gente.

    Vamos as dicas.

    Então Sink0, tudo bem ? Eu estou começando a dar uma olhada nesse assunto, apenas por curiosidade. E dando uma ollhada na internet eu achei um lin que possui diversos Crawler feitos em java, segue ai o link abaixo :

    http://java-source.net/open-source/crawlers

    Caso você queira fazer um do zero, tem um livro chamado A arte do Java, onde o mesmo aprensenta um capitulo explicando como se faz um crawler em java.
    Olha, vamos nos falando, meu e-mail é nunes.mauricio@gmail.com.

    Abraços.




  1. Sink0
    Offline
    Posts: 30

    Comment Arrow

    Publicado em: 10/04/2009 05:18:44

    Isso vai ajudar bastante, so que o o estilo que eu quero eh bem o que o afonso fez pq no meu caso o prgrama vai ter passar por um login basico , mas depois ele vai ficar estatico em uma pagina pegando valores e inserindo. Mas a juda eh bem valida, e vamos nos falando. Meu e-mail é:
    sink00@gmail.com




  1. Relacionados




  1. Anunciante





New Topic    Reply Message     Forum Main Page -> Java Básico


Goto page 1