你的位置:万博manbext体育官网(中国大陆)官方网站登录入口 > 新闻资讯 > 现金万博manbext体育官网app平台话语模子倾向将这些词汇分拆为两个单词而非驼峰式定名-万博manbext体育官网(中国大陆)官方网站登录入口

现金万博manbext体育官网app平台话语模子倾向将这些词汇分拆为两个单词而非驼峰式定名-万博manbext体育官网(中国大陆)官方网站登录入口

发布日期:2025-06-23 06:10    点击次数:51

Apple在AI方面一直被合计过期竞争敌手,但在袖珍模子方面原本有惊喜。最近有媒体测试Apple的全新Speech框架中SpeechAnalyzer和SpeechTranscriber模块,发当今语音转录速率方面大幅突出基于OpenAI Whisper的现存用具。

MacStories剪辑John Voorhees在文告中指出,他弥远濒临语音转托付具速率徐徐的困扰,畸形是在制作AppStories、NPC和Unwind等Podcast节目时,需要为YouTube上传字幕文献。现时市面上大部分转托付具皆基于OpenAI于2022年发布的开源语音转文本模子Whisper,固然老本便宜(每百万token不及1好意思分),但速率较慢。

为了测试Apple新时间的性能,Voorhees的女儿Finn开拓了一个名为Yap的敕令行用具,该用具欺骗SpeechAnalyzer和SpeechTranscriber处置音频和视频文献,并输出SRT和TXT局势的转录文献。Finn默示开拓该用具仅需约10分钟时期。

测试接受了AppStories第441集的7GB 4K视频,长度约34分钟。Voorhees区别使用Yap、VidCap和MacWhisper(V2 Large和V3 Turbo模子)进行转录测试,戒指清楚Apple新时间的昭彰上风。

具体测试戒指清楚,Yap仅需45秒完成转录,MacWhisper Large V3 Turbo模子需要1分41秒,VidCap需要1分55秒,而MacWhisper Large V2模子则需要3分55秒。Yap的证据比速率最快的竞争敌手快2.2倍。

在转录准确性方面,三种用具的证据旁边,皆在处置姓氏和“AppStories”等罕见名词时遭受同样远程,话语模子倾向将这些词汇分拆为两个单词而非驼峰式定名。Voorhees默示这些问题可通过寻找和取代规章舒缓修正。

Voorhees强调速率进步的着急性,固然45秒与1分41秒的相反看似眇小,但关于需要处置多半视频本色的用户而言,积贮效力显赫。他以处置Apple Developer在YouTube发布的数小时视频为例,指出2.2倍的速率进步将节俭多半时期。

SpeechAnalyzer和SpeechTranscriber时间接受本机处置模样,无需依赖云缱绻劳动,可在iPhone、iPad、Mac和Vision Pro等Apple设立上开动。这种设想不仅进步了处置速率,也确保了用户数据的诡秘保护。

Voorhees瞻望,Apple的新语音转录时间将取代Whisper成为Apple平台上转录应用关节的默许模子。他合计这项时间在转录速率方面的要紧打破,关于需要为YouTube视频制作字幕、为学校讲座生成转录文本等用途的用户而言,将带来显赫改善。

该时间现时仅在Apple的OS测试版块中提供,开拓者需圭表有Apple开拓者账户才调探听。Voorhees提议有有趣测试的用户装配macOS Tahoe测试版,并从GitHub页面装配Yap用具。

起首:MacStories现金万博manbext体育官网app平台



Powered by 万博manbext体育官网(中国大陆)官方网站登录入口 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024