Skip to content

9TSe/Crawl-csdn-with-go

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

当前版本 : 0.0.1

当前功能 : 程序内改写主页url, 以获取最近20篇内容的html格式, 保存于当前目录的文件内(article.txt) 每篇文章中间隔三行空格

还需完善 : 代码块内没有换行, 无法搬运所有文章(环境导致加载文章失败, 考虑清除cookie后...) 目前爬取的是type=lately, 目标爬取type=blog

可以使用的工具 : html转md

预期效果 : 输入用户url即可得到该用户所有文章的md格式文件, 方便获取他人笔记以自用

About

传入url爬取CSDN的文章

Resources

Stars

Watchers

Forks