使用 JavaScript 对任何内容进行 Web 抓取
Web Scrape Anything with JavaScript
一门基于项目的课程,为您提供了在互联网上抓取、抓取和建模任何数据的工具
我们将构建 6 个真实世界的项目
没有虚假、无聊的应用程序
工作板刮板
我们抓取一个真正的工作委员会,过滤和重新利用数据
Twitter 引用机器人
我们将创建一个自动化机器人,每天发布自定义报价
谷歌趋势聚合器
我们将识别、抓取和组织互联网上的热门话题
股票价格刮板
我们将使抓取股票价格变得非常简单,并部署此代码以每天运行
Reddit 爬虫
我们将浏览 Reddit – 点击、滚动和抓取评论
Instagram爬虫
我们将练习登录应用程序,并在最终的 3 部分项目中介绍高级抓取
我们将使用的技术
JavaScript + Node JS
Node JS 是 JavaScript 的后端版本。如果您不熟悉它,我们将一起设置它。
Twitter + Github Jobs API
熟悉这两个 API 可以让您构建大量很酷的东西。这正是我们要做的。
Google Sheets API
我们的课程数据库。很高兴知道,易于设置,易于更换为您想要的任何数据库。
Cheerio JS
一个流行的低开销解析库,可帮助我们从网页中提取数据
Puppeteer + Chromium
全功率抓取卷筒纸。使用这些工具,我们可以登录网站、单击、滚动、执行 JavaScript 等。
Cloud Functions + Scheduler
除非您部署它们,否则许多刮板是无用的。因此,我们将部署 3 个具有云功能的不同项目
还有更多
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)