HN 瞎聊
← 返回首页

AI 技术说明

了解 HN 瞎聊 背后的 AI 技术栈

透明声明

本播客的所有内容均由 AI 生成,包括话题筛选、对话脚本编写、语音合成,以及 Show Notes 的整理。我们相信 AI 生成内容应该被透明地标注,因此在每一期节目和本网站的各个位置都有明确说明。

完整技术栈

1. 话题筛选

数据源:通过 Hacker News API 获取首页新闻和评论

AI 模型:longCat-Flash-Chat

筛选标准:评估新闻价值、讨论深度、技术相关性和话题多样性

输出:每日精选 6-8 条最值得讨论的新闻

2. 对话脚本生成

AI 模型:mistral-large-latest

对话风格:自然、口语化,带有适度的幽默和批判性思考

内容来源:新闻原文 + HN 评论区精华讨论

3. 语音合成

TTS 引擎:Azure Text-to-Speech

语音模型:

  • 小雅:zh-CN-Xiaochen:DragonHDFlashLatestNeural
  • 老冯:zh-CN-Yunxiao:DragonHDFlashLatestNeural

音频处理:自动添加背景音乐、淡入淡出效果和对话间隔

输出格式:MP3,比特率 128kbps

4. Show Notes 生成

AI 模型:mistral-large-latest

内容:自动提取新闻标题、链接、HN 讨论链接和简短描述

格式:结构化 Markdown,便于网站展示

5. 网站与托管

前端框架:Astro + Tailwind CSS

音频存储:Cloudflare R2

网站托管:Cloudflare Worker

RSS Feed:标准 Podcast RSS 2.0 格式,支持 iTunes 标签

自动化工作流程

整个播客制作流程完全自动化,每日执行:

  1. 抓取数据:从 HN API 获取当日首页新闻和热门评论
  2. AI 筛选:评估新闻价值,选出 6-8 条最值得讨论的话题
  3. 生成蓝图:根据新闻内容和评论,生成两位主播的对话蓝图,包含主要观点和讨论结构
  4. 生成脚本:根据新闻内容和评论,生成两位主播的对话脚本
  5. 语音合成:将脚本转换为自然语音,添加音效和背景音乐
  6. 生成 Show Notes:提取关键信息,生成结构化的节目笔记
  7. 发布上线:上传音频到 R2,更新网站内容,推送 RSS Feed

质量控制

虽然内容由 AI 生成,但我们仍然注重质量:

  • 事实核查:AI 生成的内容基于真实新闻和评论,不会编造事实
  • 多样性:确保每期节目涵盖不同类型的技术话题
  • 可读性:对话脚本经过优化,确保自然流畅
  • 音频质量:语音合成使用高质量模型,音效处理专业

已知局限性

作为 AI 生成的播客,我们也有一些局限:

  • 缺乏真实情感:虽然对话自然,但缺少人类主播的真实情感和临场反应
  • 深度有限:AI 的理解深度可能不如资深技术专家
  • 语音合成:虽然接近真人,但仍可能有轻微的机械感

开源与透明

我们计划将播客生成的核心代码开源,让更多人了解 AI 播客的制作流程。如果你对技术细节感兴趣,欢迎关注我们的 GitHub 仓库

如果你发现内容错误或有任何建议,欢迎通过 关于页面 联系我们。

返回关于页面
正在播放 加载中...
0:00
0:00