Earkind 的主要功能包括:
- 使用语言模型 (LM) 结合神经表达文本转语音和程序化音频编辑来创建完整的播客剧集和描述。
- 从 arXiv 论文中抓取标题和摘要信息,以及使用 chatGPT API 从原始 PDF 文本中提取其他详细信息。
- 为播客的每个部分和小节设计的系统和用户提示,允许根据提示的复杂性进行 0 或 1 次生成。
- 以角色之间的对话形式呈现引人入胜的内容,包括热情的主持人、讽刺的分析师和知识渊博的研究专家。
- 使用各种广告歌曲、音效和背景编辑播客使用 Pydub 制作音乐,确保获得精致而专业的音频体验。
- 使用 chatGPT 自动生成带有时间戳和标题的播客描述。