来源:砍柴网
当元宇宙、AIGC 等新技术、新概念推出后,也催生出实时互动场景更多创新的玩法和可能性。实时互动开发者在搭建新场景时,除了音视频 API 以外,还需要视频特效、实时变声、语音转文字、实时翻译、内容审核等扩展能力的开发和集成,才能搭建最佳体验感的场景玩法。而这些功能开发完成上线至少要耗时几个月,会造成项目周期长、研发资源投入大,也可能会错失产品的最佳市场验证时间。
【资料图】
如何缩短研发路径,帮助开发者高效集成场景所需实时互动能力?声网云市场一直在致力于解决开发者的难题,打造了“实时互动开发者的 API 商店”,让开发者在使用声网 RTC 的同时,可以快速集成音视频扩展能力,比如美颜、变声、语音转文字、实时翻译、视频审核、语音审核等等,让开发者专注在业务逻辑和用户体验上,免去了音视频集成模块的诸多烦恼,加速搭建产品和商业化的全流程。
高效集成和丰富功能插件的背后,是声网云市场全球顶尖合作伙伴的支撑。目前声网云市场优选的实时互动领域伙伴包括相芯、商汤、火山引擎、依图、图普、科大讯飞、微软、喜马拉雅、大饼引擎、Voicemod、Banuba、DeepAR 等,提供插件覆盖能力包括视频特效、音频特效、语音转文字、内容审核等,开发者可以自主选择不同品牌、不同场景以及不同客户端平台的插件,来满足各种业务场景的需求。
以往,音视频开发者需要花费大量的时间选型、比价、测试、集成音视频能力,导致应用的整体开发周期较长。现在,开发者可以在声网云市场上一站式进行选型、比价、测试、集成各类音视频插件,通过 3 个标准 API, 快速集成音视频扩展能力,之前可能需要 120 个小时开发的项目能缩短至 2.5 个小时,节省了 95% 的集成时间,轻松构建丰富多样的音视频场景,让开发者更加专注于业务逻辑和用户体验。
不仅如此,实时互动应用开发过程中,往往会遇到一系列的音视频体验问题,比如:音画不同步、黑屏、卡顿、机型适配、性能、模块接入难、线程调度繁琐、回声、啸叫、双通道多通道等技术难点。声网作为国内领先的实时互动 API 服务商,把 RTE 扩展能力集成的最佳工程实践提供了出来,一次性地为开发者解决了以上所有这些问题。“声网云市场的愿景就是将声网提供的实时互动技术服务与行业更多的技术能力做更紧密的整合,把开发一个实时互动应用要做的 N 件事尽可能的变成 1 件事,我们也希望声网的实时互动能力就像一颗大树的树根,以声网为基础设施,我们会源源不断地为实时互动领域提供营养和水分,为开发者提供无穷无尽的实时互动能力。让下一个现象级的实时互动应用,可以在这个生态里不断萌发。”声网云市场负责人柏闻表示。
客户证言:
——某泛娱乐电竞陪玩客户,需要连麦场景下,准确检测音频违规风险、以及定制化的审核方案,使用依图音频审核插件:
“几经比较,我们选择了在声网云市场接入数美语音审核插件。相比自行对接各种功能,插件集成的方式减轻了一部分研发负担,集成快,降低了新功能的开发成本。”
——某出海社交客户,需要准确的识别频道内多语种的音频进行转写,并准确、迅速的翻译,使用微软转写&翻译插件:
“我们使用了声网云市场上的微软实时转写&翻译插件,几天内就完成了插件集成,让 App 迅速在越南、土耳其、西班牙等 21 个国家的 App 上线运营。开发过程中,插件很易用,统一跟声网结算也省去了我们很多烦恼。”
——某海外社交客户,需要在直播常间加入美肤、美型、美妆、手势表情识别、滤镜贴纸等需求,使用相芯美颜插件:
“实际集成的时间少于一周。如果我们不升级声网 SDK 4.0.0,用裸数据的方式去集成,可能需要花费几个月的时间。”
标签: