Audio Note是什么?
Audio Note 是一款基于OpenAI Whisper模型的本地实时语音转文字工具,支持从麦克风、应用程序音频及音视频文件中提取语音并自动转录为文本,支持多语言识别兼容 MP3、WAV、FLAC 等多种主流格式,并可导出 SRT、VTT 等字幕文件。整个转录过程完全在本地设备完成,保障数据隐私与安全,特别适合处理敏感音频内容。适用于会议纪要、观看录像字幕生成、实时直播间互动多种场景的使用体验。
主要功能特点
实时语音转录:麦克风、系统音频、程序音频均可实时抓取并文字转写,适用于会议记录、在线上课、在线直播字幕场景,支持歌词模式显示(一边播放一边浏览)。
音视频文件转写:可以上传 MP3/WAV/FLAC/M4A/MKV 等格式的音视频文件进行音频自动转录,用于后期归档整理使用。
字幕导出与格式支持:可以导出 SRT/VTT/ASS/LRC/SSA/SBV/SMI 字幕文件用于剪辑制作教学视频或内容本土化等用途;
本地运行,数据安全:可以在本地全部操作,不联网也不上传音频,可满足采访、会议、病历等敏感素材处理使用。
GPU加速与Whisper高级设置:包括 Mac M 系列芯片和 Windows 的 CUDA/Vulkan 显卡加速以及自定义 Whisper 参数,如 prompt, offset, 搜索等;没有 GPU 也可以回退成 CPU 模式运行。
多语言支持与翻译功能:多达 50 种以上语种语音识别及翻译,可以把文字内容转换成其它语言。
AI 助手与工作流集成:有内置 AI 聊天助手,可以用其来辅助生成文档摘要、整理笔记要点等,也可以指定应用录制之后稍后再转写,更方便实用。
产品价格
方案类型
价格(按月)
价格(按年)
核心功能亮点
设备绑定
Token 配额
启动版
免费
免费
支持转录 1GB 内音频、使用微型模型、文本导出、CPU 转录
1 台
每月 50,000 个
标准版
¥9
¥7/月
支持实时转录、应用音频录制、翻译、GPU 加速、导出字幕、多格式支持等
2 台
每月 1,000,000 个
高级版
$12
$9/月
包含标准版全部功能,支持所有实时模型、社区模型、三设备绑定
3 台
每月 2,000,000 个
终身版
$199
$139(限时)
一次性购买,终身使用所有功能,5 台设备绑定,2 年内每月 2,000,000 Token 配额
5 台
终身使用 + 2 年配额
适用场景
工作学习:会议记录、课堂笔记、访谈整理。
内容创作:视频字幕生成、播客脚本撰写、配音文稿制作。
个人用途:听力材料转写、语言学习、听力障碍辅助。
使用方法
第一步、下载安装 :上Audio Note官网,挑个适合你电脑(Windows 或 Mac)的版本下载。 然后一路点下一步就搞定了。
第二步、导入音频或视频文件:打开 Audio Note, 按下新建“导入文件”,然后从电脑里面找到你的音频或者视频(MP3/WAV/FLAC/MKV 都可以)文件就可以。
第三步、实时录制或转录:想实时录,就点击“实时录制”,确保麦克风能用,然后点“开始”。 软件会自动把你说的话转成文字,或者你也可以录其他软件的声音。
第四步、调节设置:点右边的“设置”,挑一个合适的模型来转录,要是觉得慢能换成 GPU 的。 如果要翻译,就选好语言。
第五步、导出转录结果:转录好了,就选那个文件,再点导出就行了;之后选你想要的格式(SRT/VTT/文本)和保存的地方就行了呗!
第六步、使用翻译功能(想用就用):要翻译的话,记得在设置里打开翻译功能。 选好你要的语言,软件就能帮你翻译了。
免责声明
- 本网站不保证第三方网站内容的准确性或可用性。
- 对因使用本网站信息而产生的任何直接或间接损失,本网站概不负责。
There are no results matching your search
© 2025 vllzen官方主页 All Rights Reserved. 本站由vllze.com驱动