初次使用听脑ai时,需要先完成账号注册。打开官方网站后,点击右上角的“注册”按钮,输入常用邮箱并设置密码,系统会向邮箱发送验证链接。验证成功后即可登录。已注册用户直接使用邮箱或手机号登录即可进入工作台。工作台界面采用极简设计,左侧为导航栏,右侧为项目列表,方便快速新建或查找已有任务。
登录后,点击“新建项目”按钮进入配置页面。首先输入项目名称,建议用简短关键词描述内容主题,例如“会议记录”“采访稿”等。接着选择语言类型:听脑ai支持中文、英语、日语、法语等超过10种语言,系统会根据选择自动启用对应的声学模型。若需要识别特定领域的专业词汇,可在“高级设置”中上传自定义词库或常用术语表。确认无误后点击“开始”,项目即创建完成并进入录音/上传界面。
听脑ai提供两种输入方式:实时录音和文件上传。实时录音适用于现场会议、课堂记录等场景,点击界面中央的红色麦克风按钮即可开始录制,录制过程中可随时暂停或继续。文件上传则支持mp3、wav、m4a、flac等常见格式,单文件最大为2GB,拖拽文件到指定区域或点击“选择文件”按钮即可导入。上传后系统会自动对音频进行降噪和音质优化,确保后续转写准确率。
音频处理完成后,听脑ai会启动云端引擎进行语音转文字。一般15分钟的音频在2–3分钟内即可输出初稿。转写结果会按时间轴分段显示,每段文字对应音频中的实际位置,点击任意段落即可从该处开始播放音频。编辑器内置智能纠错功能,自动修正常见的同音错别字,并识别标点符号和段落结构。用户也可以手动拖动时间轴标记重点内容,或使用“智能摘要”按钮一键生成核心要点列表,避免通篇阅读。
听脑ai支持多人协作编辑同一份文稿。在项目页面点击“邀请成员”,输入对方邮箱或分享链接,即可赋予查看或编辑权限。每位成员的修改记录都会保留在操作日志中,方便回溯。同时,编辑器提供“高亮批注”功能,选中任意文字后可添加批注或修改建议,其他成员可实时看到并用不同颜色标记已处理项。对于需要反复校对的长文稿,建议使用“对比模式”查看原始转写内容与最终定稿的差异。
完成编辑后,点击“导出”按钮进入导出设置。听脑ai支持输出为纯文本(.txt)、Word文档(.docx)、SRT字幕文件、PDF以及Markdown格式。用户可根据用途选择:字幕导出可用于视频后期制作,Word文档适合打印或提交报告。导出前可勾选“包含时间戳”“删除填充词”等选项,进一步优化输出内容。所有导出文件会打包成zip压缩包下载到本地,也可直接通过系统内置邮件功能发送给指定收件人。
所有已完成的项目都会保存在工作台的历史列表中,按最后编辑时间倒序排列。每个项目卡片上显示名称、语言、时长和最后修改时间。点击卡片可快速进入编辑界面,无需重新上传音频。顶部搜索栏支持按项目名称或关键字检索,检索结果会高亮显示匹配位置。对于长期使用者,建议定期为常用项目添加标签(如“客户”“内部培训”),之后可按标签筛选,大幅提升查找效率。
听脑ai提供微信小程序和iOS/Android App,功能和网页端基本一致。手机端利用设备麦克风可直接录音,录制完成后自动上传转写,适合外出访谈或临时会议。移动端编辑界面针对触屏优化,双指缩放可调整时间轴精度,长按文字区域可唤出快捷菜单(复制、标记、添加批注)。需要注意的是,移动端暂不支持文件上传功能(请使用网页端处理已有音频文件),但已创建的项目可在手机和电脑之间自由切换,数据实时同步。
为提高转写准确率,建议录音时尽量靠近音源,避免环境噪音。若音频中包含多人对话,可在录音前开启“说话人分离”开关(网页端高级设置),转写结果会按不同发言人分段,并自动标注为“发言人1”“发言人2”等。对于外语材料,可在转写后启用内置翻译功能,将文字即时译为目标语言,翻译结果可直接替换原文或作为对照栏显示。所有操作均不上传敏感数据至第三方,听脑ai采用端到端加密,用户可放心处理机密内容。