speech framework 中有怎么区分对话的 api 吗

Asked on 06/16/2025

3 searches

在WWDC 2025中,Apple介绍了一个新的API,名为Speech Analyzer,它是Speech Framework的一部分。这个API在iOS 26中引入,支持更多的用例,并且比之前的SF Speech Recognizer更快、更灵活。Speech Analyzer特别适合处理长时间和远距离的音频,如讲座、会议和对话。

Speech Analyzer API的设计包括Speech Analyzer类和几个其他类。你可以将一个模块类添加到分析会话中以执行特定类型的分析。例如,添加一个转录模块可以使会话成为一个转录会话,执行语音到文本的处理。你可以将音频缓冲区传递给分析器实例,它会通过转录器和其语音到文本模型进行路由。模型预测与所说音频相匹配的文本,并将其返回给你的应用程序。

如果你想了解更多关于Speech Analyzer的详细信息,可以查看Bring advanced speech-to-text to your app with SpeechAnalyzer (02:41) 这一章节。