(18952期)私人全网情报系统:自动汇总公众号B站抖音,AI筛重点生成日报,信息不再错过 (教程+源代码)

使用工具与原理
- 利用 “语鲸” 进行信息聚合与初步处理。它可将公众号、网站等内容自动变成可精准检索的私域知识库,还能根据设置的信源和关键词筛选信息,自动生成热点专题并进行 AI 总结,也具备日报功能,汇总每日更新文章并附热点词云图。
- 结合开源项目 “Everything Capture” 实现更强大的本地存储与 AI 分析功能。它是个人内容收藏与知识管理工具,可采集公众号、抖音等平台内容,自动提取正文、下载媒体,内置 AI 助手能对收藏库进行问答、摘要等操作。
具体搭建教程
- 语鲸部分:
- 订阅官方精选:下载 “语鲸” APP,注册登录后,在频道广场订阅官方精选频道,如 “热门 AI 公众号更新追踪” 等,快速熟悉工具功能。
- 创建私人频道:若关注特定公众号或 B 站 UP 主、抖音博主等,可创建私人频道。例如,创建 “行业动态” 频道,将相关行业媒体公众号、博主主页网址等作为信源添加进去。也可通过关键词筛选,如创建 “抖音热门游戏” 频道,设置关键词 “抖音游戏热门视频”,让其只推送相关内容。
- 利用专题与日报功能:创建多个频道后,语鲸会自动识别热点并生成专题,聚合相关文章并给出 AI 总结。每天可查看日报,快速了解订阅频道的更新内容和热点词云。
- Everything Capture 部分:
- 项目部署:该项目支持 Docker 运行或本地源码运行。若用 Docker,需安装 Docker 环境,然后拉取相关镜像运行。若用本地源码,需根据其文档配置 Python 环境及相关依赖,下载源代码后运行。
- 内容采集:在手机端可设置快捷指令,如在 Safari 分享菜单中调用,将公众号、抖音等链接推送到后端自动提取内容。也可通过手机网页采集页,手动粘贴链接采集。它会自动提取正文、下载图片视频等,并进行 OCR 文字识别、语音转文字等操作。
- AI 分析:采集内容后,可利用内置 AI 助手进行分析。在 Chat 模式下,可对某篇文章或整个知识库提问获取摘要等信息;在 Agent 模式下,可让 AI 按语义整理内容到文件夹、自动打标签等,方便后续查找和管理。
相关源代码
- 语鲸大模型相关代码:语鲸大模型(LingoWhale-8B)已开源,GitHub 地址为https://github.com/DeepLangAI/LingoWhale-8B,Huggingface 地址为https://huggingface.co/deeplang-ai/LingoWhale-8B,可从此处获取模型相关代码及使用示例。
- Everything Capture 源代码:该项目开源,可在其相关介绍页面(https://juejin.cn/post/7622973041178411048)了解详情,虽未直接给出完整代码链接,但可根据文中介绍的技术栈(Python FastAPI 后端等)及运行方式,结合开源项目常见的托管平台(如 GitHub),推测其可能存在的代码仓库地址,或通过相关技术关键词搜索其开源代码。
此外,若想进一步自定义开发,还可参考其他开源情报项目如 “Shadow broker”(https://explainx.ai/blog/shadowbroker-open-source-intelligence-platform)、“phantom signal”(https://pypi.org/project/phantomsignal/)等的代码逻辑和功能模块,它们具备不同的情报收集和分析能力,可按需整合到自己的系统中。
声明:如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
注:文中内容出了标题和图片以外,内容为AI所写,如有雷同,请联系wuliuyiwu@foxmail.com删除,谢谢!

评论(0)