智猩猩-FPGA加速超低延迟大并发实时智能语音识别-Achronix资深现场应用工程师黄仑_第1页
智猩猩-FPGA加速超低延迟大并发实时智能语音识别-Achronix资深现场应用工程师黄仑_第2页
智猩猩-FPGA加速超低延迟大并发实时智能语音识别-Achronix资深现场应用工程师黄仑_第3页
智猩猩-FPGA加速超低延迟大并发实时智能语音识别-Achronix资深现场应用工程师黄仑_第4页
智猩猩-FPGA加速超低延迟大并发实时智能语音识别-Achronix资深现场应用工程师黄仑_第5页
已阅读5页,还剩40页未读, 继续免费阅读

下载本文档

kok电子竞技权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

kok电子竞技:文档简介

-TTS/SS语音合成,用于将输出文本再次翻译成语音2?将提取的特征转化为统计参数语音模型,并与其他模型进行比较?使用语法规则和某些声音同时出现的概率来帮助确定哪些单词序列是可能的FilteringFilteringExtractingAnalyzing3-文本预测器作为语言模型(通常是LSTM)-Joiner结合了编码器和预测器的输出-Linearlayer线性层和SoftmaxSoftmaxJoinerAudioEncoder4-编码器将输入序列映射到连续表示序列-解码器接收编码器和上一步的解码器输出,生成输出序列-处理长序列困难-难以并行化-对比实时流处理仅适用于离线模型?2023AchronixSemiconductorCorporation.ConfidentialInformatio6Achronix和Achronix和Myrtle.ai的ASR-1UCPU服务器加上Speedster7t1500PCI-Myrtle.AI提供的CPU和FPGA应用程序7AudioDecodePre-ProcessingRNN-TInferenceServerWebSocketServerASRDecoderASREncoder9?2023AchronixSemiconduct-与A100GPU相比减少了90%(<60毫秒端到端-可针对其他语言和自定义数据集重新训练?2023AchronixSemiconduct-非离线或者事后处理-非单个用户,嵌入式产品-低延时对于服务提供商来说是一个关键的指标?2023AchronixSemiconduct-它可以比其它的方案转录更多的实时语音流-流模式只能看到句子已经说出来的部分-流模式实时转录说出来的每个词,而不是播客-呼叫联络中心,自动填写表格-视频会议:实时字幕+翻译-语音个人助手-实时字幕?2023AchronixSemiconduct-一组转录中的错误百分比-正确率,我们通常用100-WER%表示-人也不能做到100%的正确率-一般来说ASR系统的错误率WER在-大部分的ASRAPI提供商出售的产品?2023AchronixSemiconduct-比如在Earnings-22这个数据集WER为17.6?2023AchronixSemiconduct-使用他们自己的数据集-加上我们开源的代码库?2023AchronixSemiconduct?2023AchronixSemiconduct-延迟降低到1/8-当前的吞吐量提高-完整产品的吞吐量?2023AchronixSemiconduct低延时语音流的性能低延时语音流的性能 -资本支出CAPEX-运营支出OPEXASR云服务(最低成本)ASR云服务(最高成本)?2023AchronixSemicon

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论