Aprenda técnicas de web scraping e web crawling para acessar dados ilimitados a partir de qualquer fonte na Web e em qualquer formato. Com este guia prático, você aprenderá como usar scripts Python e APIs da Web para coletar e processar dados de milhares – ou até mesmo milhões – de páginas web ao mesmo tempo.
Ideal para programadores, profissionais de segurança e administradores da Web familiarizados com Python, este livro não só ensina o funcionamento básico do web scraping, mas também se aprofunda em tópicos mais avançados, como a análise de dados brutos ou o uso de scrapers para teste web em frontend. Exemplos de código estão disponíveis para ajudá-lo a entender os conceitos na prática.• Aprenda como analisar páginas HTML complicadas.• Percorra várias páginas e diversos sites.• Obtenha uma visão geral das APIs e de como elas funcionam.• Aprenda vários métodos para o armazenamento dos dados coletados.• Baixe, leia e extraia dados de documentos.• Use ferramentas e técnicas para organizar dados mal-formatados.• Leia e escreva em idiomas naturais.• Rastreie formulários e logins.• Aprenda como fazer o scraping de JavaScript. • Conheça o processamento de imagens e o reconhecimento de texto.
Description:
Aprenda técnicas de web scraping e web crawling para acessar dados ilimitados a partir de qualquer fonte na Web e em qualquer formato. Com este guia prático, você aprenderá como usar scripts Python e APIs da Web para coletar e processar dados de milhares – ou até mesmo milhões – de páginas web ao mesmo tempo.
Ideal para programadores, profissionais de segurança e administradores da Web familiarizados com Python, este livro não só ensina o funcionamento básico do web scraping, mas também se aprofunda em tópicos mais avançados, como a análise de dados brutos ou o uso de scrapers para teste web em frontend. Exemplos de código estão disponíveis para ajudá-lo a entender os conceitos na prática.• Aprenda como analisar páginas HTML complicadas.• Percorra várias páginas e diversos sites.• Obtenha uma visão geral das APIs e de como elas funcionam.• Aprenda vários métodos para o armazenamento dos dados coletados.• Baixe, leia e extraia dados de documentos.• Use ferramentas e técnicas para organizar dados mal-formatados.• Leia e escreva em idiomas naturais.• Rastreie formulários e logins.• Aprenda como fazer o scraping de JavaScript. • Conheça o processamento de imagens e o reconhecimento de texto.