博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
用node.js做一个爬虫
阅读量:6788 次
发布时间:2019-06-26

本文共 1063 字,大约阅读时间需要 3 分钟。

用node.js做一个爬虫

var express = require('express');var superagent = require('superagent');var cheerio = require('cheerio');// 调用 express 实例,它是一个函数,不带参数调用时,会返回一个 express 实例,将这个变量赋予 app 变量。var app = express();app.get('/', function (req, res, next) {  // 用 superagent 去抓取 https://cnodejs.org/ 的内容  superagent.get('https://cnodejs.org/')    .end(function (err, sres) {      // 常规的错误处理      if (err) {        return next(err);      }      // sres.text 里面存储着网页的 html 内容,将它传给 cheerio.load 之后      // 就可以得到一个实现了 jquery 接口的变量,我们习惯性地将它命名为 `$`      // 剩下就都是 jquery 的内容了      var $ = cheerio.load(sres.text);      var items = [];      $('#topic_list .topic_title').each(function (idx, element) {        var $element = $(element);        items.push({          title: $element.attr('title'),          href: $element.attr('href')        });      });      res.send(items);    });});app.listen(3000, function (req, res) {  console.log('app is running at port 3000');});

思想来源:https://github.com/alsotang/node-lessons/tree/master/lesson2

转载于:https://www.cnblogs.com/lswit/p/4829179.html

你可能感兴趣的文章
编程中最神奇的数字,你知道吗?
查看>>
数据可视化:柱状图、雷达图等六种基本图表的特点和适用场合
查看>>
选择器 :gt(index)
查看>>
notes on python
查看>>
kafa
查看>>
资源 | Feature Tools:可自动构造机器学习特征的Python库
查看>>
linux Shell 中常用的条件判断
查看>>
angular 动态设置blob链接给 ng-href时遇到unsafe 解决方案
查看>>
Java与Highcharts实例(四) - Hello Highcharts (后台Java传递数
查看>>
连接数据库的操作 总结
查看>>
Android 小米手机开发APP图标更换后还显示原来的图标
查看>>
在代码中修改Shape的solid属性的color值
查看>>
MySQL字符集问题
查看>>
Java多线程总结
查看>>
iPad Mini外屏碎了 换屏幕教程
查看>>
LinkedBlockingQueue操作,线程安全问题,ConcurrentModificationException 异常分析与解决方案...
查看>>
redis3.2新功能--GEO地理位置命令介绍与实战开发
查看>>
java 通过ssh 执行命令
查看>>
算法导论——基数排序(基于计数排序)
查看>>
19.TCP的交互数据流
查看>>