关于
归档
友链
猫咪
RSS
后台
切换模式
返回顶部
首页
说说
日常
开发
游戏
资源
虚拟货币
首页
说说
日常
开发
游戏
资源
虚拟货币
关于
归档
友链
猫咪
RSS
后台
TeleMediaSpider - Telegram 频道资源爬虫
开发
·
06-08
·
更新于 14 天前
LiesAuer
## 声明 ***仅限个人用途使用。*** ## 介绍 [TeleMediaSpider](https://github.com/liesauer/TeleMediaSpider) 是一个开源的用于抓取 Telegram 频道资源的个人爬虫,支持抓取 `图片` `视频` `音频` `文件`,支持多频道同时下载,支持断点续抓。 ![screenshot.jpg](https://storage.liesauer.net/2024/07/3037476710.jpg) 仓库地址:https://github.com/liesauer/TeleMediaSpider ## 使用说明 ### 0. 下载 已打包好的 `TeleMediaSpider` 可在这里下载:[https://github.com/liesauer/TeleMediaSpider/releases](https://github.com/liesauer/TeleMediaSpider/releases),包含 `Windows x64` `Linux x64` 多个版本,如需其他版本,请自行打包。 ### 1. 首次运行 第一次运行时,会自动生成 `data/config.toml` 配置文件,需要配置以下内容: `account.apiId`(参考文档) `account.apiHash`(参考文档) `account.account`(Telegram账号) ~~`account.session`~~(这个不需要填) 参考: [Authentication | GramJS](https://gram.js.org/getting-started/authorization#getting-api-id-and-api-hash) 代理看情况配置,可参考[Using MTProxies and Socks5 Proxies.](https://gram.js.org/getting-started/authorization#using-mtproxies-and-socks5-proxies)。 ### 2. 获取频道列表 ```bash TeleMediaSpider --list ``` 列举出你账号加入的所有频道,复制频道ID,并打开 `data/config.toml` 配置文件,配置以下内容: `spider.channels` 示例: ```toml [spider] channels = [ "频道id1", "频道id2" ] ``` 如何抓取自己的已保存信息? 使用固定的频道id:`me` 即可,其他不变。 默认抓取频道的`图片` `视频` `音频` `文件`,如果你想特定的频道只抓取特定的数据,也可自由配置,有效值:`photo` `video` `audio` `file`。 将以下配置 ```toml [spider] medias = { } ``` 修改为 ```toml [spider] [spider.medias] 频道id1 = "photo" 频道id2 = "photo,video,audio,file" ``` ### 3. 正式抓取 直接运行 `TeleMediaSpider`,爬虫将会自动抓取频道信息,自动获取新消息,支持断点续爬,可任意时刻随意关闭软件。 ## 4. 并发下载 **注意:这并不是传统意义上的并发下载,而是指多频道同时下载,单一频道只能一条一条信息从前往后解析下载。** 将以下配置 ```toml [spider] concurrency = 5 ``` 修改为你想要的多频道同时下载数,默认为5个频道同时下载。 # 数据保存 所有数据都保存在 `data/{频道id}` 文件夹下,文件名格式:`{频道id}_{消息id}[_{原文件名}]`。
TeleSpider
Telegram
spider
gramjs
downloader
爬虫
纸飞机
取消回复
提交评论
夸克网盘资源
06-08
回复
马克一下,感觉正好需要这个爬虫。哈哈
瞅一瞅叭
空空如也
服务器推荐
RackNerd 2C2G $20.98/年(美国 隐藏款)
狗云 1C0.75G ¥150/年(香港 BGP)
最新评论
夸克网盘资源: 太先进了,我想实现,不知道怎么弄
左来: 是不是也可以跟wordpress似的汉语转拼音
dujun: 取标题对应的英文 slug 一直是我写文章的难题。它这个不做翻译...
夸克网盘资源: 马克一下,感觉正好需要这个爬虫。哈哈
xiaohu: 牛逼一
mo: 为什么群进不去
jiyouzhan: 这篇文章写得深入浅出,让我这个小白也看懂了!
关于站长
广东 佛山
liesauer#liesauer.net
LiesAuer
CC BY-NC-SA 4.0
粤ICP备16094588号-1
萌ICP备20245567号
Theme
Jasmine
by
Kent Liao
马克一下,感觉正好需要这个爬虫。哈哈