1. 首页
  2. 资讯
  3. 项目

语音链(VOC)基于区块链技术的语音人工智能训练系统

VOC 语音链是基于区块链技术的语音资料与人工标识信息存储工具,致力于解决 AI 语音发展面临的数据瓶颈,也是目前区块链技术应用中大数据领域最落地的场景应用。VOC 语音链致力于建设辐射全球的语料资源平台,通过社群成员协作的力量为 AI 语音识别的发展提供全球最大、最丰富、最精准的训练数据源,实现打造全球最大的去中心化人类语音数据生态愿景。真正让数据“取之于民,用之于民”,并让大数据的变现价值“源自于民,归还于民”。

2017 开始,作为最火热的区块链技术,随着 “区块链+产业”不断推进,区块链正扮演着大数据与人工智能技术发展的“催化剂”。那么随着 AI 语音商业应用场景的极速发展与需求的快速增长,VOC 语音链将逐渐显示其不容小觑的巨大商业价值潜力。

VOC 语音链与大数据、人工智能的技术关联

大数据是生产资料,它帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求,使数据能够从量变到质变,产生真正的价值。而人工智能作为生产力,它的发展是需要学习海量的知识和经验,也就是需要大数据的支撑;反过来人工智能技术也促进了大数据技术的进步,两者相辅相成。

但随着两种技术的发展,“数据安全性无法保障,数据存在被操纵的可能,数据
流通环节的信任和确权得不到保证”等安全性问题也越发凸显,此时具有去中心信任机制、防篡改、记账透明、共监管和可追溯性的区块链技术就成为了两者的最后一块拼图,能够成为解决数据安全短板的一剂良药。

1.区块链与大数据的技术关联

谷歌的 GFS 和 Hadoop 的 HDFS 奠定了大数据存储技术的基础。而区块链本质上也是一种分布式的数据库系统,区块链技术作为一种链式存取技术,通过网络中多个节点参与计算的节点来共同维护。从数据存储上来讲,区块链技术也是一种特定的数据库技术。大数据和区块链的分布式存储可以说成是HDGS和区块。

语音链(VOC)基于区块链技术的语音人工智能训练系统

区块链网络其不可篡改的特性,让数据的可追溯质量获得了前所未有的信用背书。而通过区块链脱敏的数据交易流通,结合大数据存储技术和高效灵活的分析技术,极大地提升了区块链数据的价值和使用空间。区块链技术可以说是大数据数据安全、脱敏、合法、正确的保证。

随着数字经济时代的发展,通过把区块链技术与大数据相连接,大数据将会在“反应——预测”模式的基础上更进一步,能够通过智能合约和未来的 DAO、DAC自动运行大量任务,解放人类生产力,让这些生产力被去中心化的全球分布式计算系统代替,那个时候将会迎来又一次的科技爆炸的时代。

2.区块链与人工智能的技术关联

区块链与人工智能在技术方面是截然不同的,但是二者之间也有一定联系。区块链中的分布式数据库技术可以与人工智能在数据上进行合作,区块链技术能够解决人工智能应用时的可信度问题,为人工智能在数据层提供可信数据,因此在区块链技术的辅助下,人工智能可以更加的将重心移到算法上,负责智能化的决策和自动化的业务处理,是区块链的智能合约更加智能。

3 区块链使得个人数据变现成为可能

Dell EMC 公司服务首席技术官 Bill Schmarzo 曾表示,区块链技术可能通过消除中间人促进交易,以实现数据和分析的共享和货币化。”在商业世界中,这给消费者提供了更强大的谈判能力。它允许消费者通过区块链控制谁有权访问他们的数据。然后,他们可以要求定价折扣,以换取消费者对于企业产品或服务的个人消费数据。

Schmarzo 对区块链如何可能导致新的数据货币化形式进行了阐述,因为它具有对大数据的以下几方面的影响:

● 参与交易的所有参与方都可以访问相同的数据。这加快了数据采集、共享、数据质量,以及数据分析。
● 所有交易的详细记录都保存在一个“文件”或区块链中。这提供了从开始到结束的事务的完整概述,消除了对多个系统的需求。
● 个人可以管理和控制他们的个人数据,而无需第三方中介或集中式存储库。

最终,区块链可以通过创建新的市场,让公司和个人可以直接共享、出售以及提供他们的数据和分析见解,从而成为数据货币化的关键推动者。

在比特币的大规模采用的带动下,区块链技术在商业和金融领域获得了成功。它促进的快速和安全的交易可能会彻底改变传统的数据系统。根据毕马威和Forrester 咨询公司的调查,三分之一的决策者信任他们公司的数据。但是区块链技术可以大大加强这种信任,其实时应用将变得更加普遍。

VOC 突破 AI 语音发展数据瓶颈

1.构建去中心化语音数据生态,打破垄断

VOC 语音链利用区块链技术的公开性与不可篡改性,从语音数据资源入手,减少信息重复采集,防止资源浪费;降低行业的竞争门槛,使得行业竞争回归与技术竞争而非资本内耗,促进行业的良性发展。

VOC 语音链将基于区块链技术采用混合共识机制,构建起全球范围的语音大数据社区。社区将贡献并连接来自全球各个国家与地区的人类自然语言语音数据,并依赖社区节点对数据质量、数据内容等进行高效的认证并进行分布式存储。与此同时,社区将共享大数据创造的价值回报,激励社区持续不断地完成从语音数据的生到处理整个流程循环,实现推进数据流动与海量增长,进而构建起拥有全球规模最大、语言种类最全、场景最丰富、最精准的高质量多语种语音数据生态。

2.为企业提供高质量、低成本数据

VOC 将利用构建起来的语音大数据社区,持续不断地产生丰富且高质量、低成本的数据,将从根本上解决 AI 语音识别的定制化商业发展瓶颈,如数据低质量、多语种语音数据匮乏、数据标注高人力成本等,为步入人工智能时代的企业与产业提供完整的 AI 语音数据定制方案。

3.建立方言与濒危语种的语音研究社区

根据联合国教科文组织发布的《世界濒危语言地图》,截至 2013 年,全世界有6000 多种语言,但是 60 亿人口中,大约 80%的人讲的都是主要的 83 种语言,而剩下的 6000 多种里,有 2500 种被列为濒危语言,其中的绝大多数甚至没有任何的文字记载,有 228 种语言几近消失。

VOC 语音链对上传的语料信息不断深加工,将语料信息的上传时间、上传地点与语料种类、准确程度分门别类记录在链上,一经确认记录,不可篡改。方言与濒危语种使用者就可以通过智能终端将语言信息通过录音、标注、上传的方式将语料信息记录在 VOC 语音链上。社区成员共同协作校对、确认、储存、整合,形成规模效应,实现濒危语种的传承,为将来的研究提供充足的素材基础。

4.解决数据安全、隐私、确权问题

众所周知,语音信息资源的采集依赖于特定的对象,其性质、内容与人身权利都高度相关,涉及到公民的人格权益,故在使用时应当受到严格的限制,并确定数据的最终所有权。 但事实上,政府监管无法深入公司的肌理,既需要付出高昂的成本,也无法真正实现消除信息泄露的风险以及实现确权。

VOC 语音链基于区块链技术的不可篡改、分布式存储与去中心化,从根本上保证了大数据的安全性。数据统一存储在去中心化的区块链上,在不访问原始数据情况下进行数据分析,既可以对数据的私密性进行保护,又可挖掘更多的数据价值。

同时 VOC 语音链将发挥社区力量,组成仲裁争议解决机构,利用公有链不可篡改的性质,将仲裁过程中的全部信息记录上链,实现完全公开透明,接受成员监督。

VOC 产品设计

1 设计参考

VOC 产品设计参考了众多国内外数据采集公司:国内如阿里众包、百度众包、龙猫众包、数据堂、海天瑞声、文思海辉等;国外如 Amazon Mechanical TurkWelcome,Mighty AI (Training Data as a Service (TDaaS))等。

2.产品机制

目前数据贡献者(合法的个体与公司)通过 VOC 将从手机、蓝牙耳机等多种终端语音接口,按具体求用输入语音的方式进行挖矿,并根据其贡献取得代币 VOC奖励;同时任何合法的公司及个人,也都可以通过支付代币 VOC 的方式获取相应的数据使用权;

关键节点将负责进行数据审核、数据处理、数据确权、数据应用等围绕着数据的多重相关工作,并获得 VOC 奖励;

语料信息通过 VOC 语音链得以充分地流动。语料信息与代币价格交替增长,实现良性互动,使得 VOC 语音链上的语料信息能够充分满足现实的研究需要。

产品特性与优势

1.最大化数据贡献者利益

VOC 实现了将人类语音数据生产源与数据需求方联通,直接互联在去中心化的生态中。有别于传统数据抓取公司,他们通过中心化的众包任务制采集数据,获取语音数据后,批量销售给不同需求的客户公司。

VOC 直接省去了中间中心化公司的角色,使得个人数据的所有权得以可追溯、可保证,实现长期享有数据带来的价值收益,以及数据后期安全问题均得以充分保障。同时,个人数据价值将在自由交易且公平、公正、安全的大数据生态中发挥到最大,获得市场持续性收益回报,避免被中心化公司一次性垄断式获取。

2.设立双边数据审核机制

产品除了贡献者将持续不断生产海量数据,同时也将由其他参与者或者关键节点对生产的数据进行质量检测与审核,如语言文字与语音音频的内容匹配度、内容完整性、清晰度等多个维度进行审核,确保建立高质量数据的有效机制。同时,审核机制将触发更加公平的、健康的语音数据生态环境,高质量高水平的数据贡献者与审核者将获得比其他人更多倍的代币回报,也即价值认可与回报。

3.多元数据处理与服务功能

除了构建海量的去中心语音大数据库以外,VOC 正陆续设计产品的多种语音数据处理功能,以充分满足 AI 语音商业应用发展的多元需求:多语种跨领域的语音数据采集、语音数据转写、语音数据标注、网络文本抓取、文本标注、情感标注、图像数据采集、图像数据标注、数据资源管理、数据质量监控等应用开发和集成定制解决方案。

VOC 基于区块链的技术解决方案

1 共识层

DPOP 共识机制:

VOC 借助 DPOP 共识机制使得语音链真正面向全球并做到去中心化。

为了建设真正面向全球,生态开放的去中心化语料资源平台,VOC 采取了最为先进的高效共识机制 DPOP(Delegated Proof of Participation),即委托参与度权益证明机制。DPOP 根据节点的历史权益和用户行为(包括在线时长、内容产出、内容审核等)来决定用户目前所拥有的权益,使得区块链上的每一个节点都可以参与到 VOC 语音链的共识和治理当中来。

基于 DPOP 机制,每个节点根据自己的权益大小有着不同的投票权。在 VOC 生产区块之前,所有节点会一起选出一定数量(N)的代理者。当超过 50%的节点都同意一个数目(N)作为代理者数量时,代理者数量得以确定。随后,总得票数前 N 的节点成为代理者。同时,所有节点也将以相同方式选出代表。代理者为 VOC 语音链生产区块,并确认上一个区块是可信的。代理者将会得到 VOC 作为报酬。而代表则负责对交易费用,区块大小和代表者工资等网络参数进行投票修改。代表不会得到额外的 VOC 报酬,因为我们不希望网络参数经常改变。

每经过一个维护间隔(maintenance interval),选票就会被重新统计一次,代表者名单也就会相应更新。相似的是,节点对代表的决议也有一定时间的复审期(review period)。此期间内,节点可以投票踢出代表并作废提议。也就是说,所有权力都还是真正掌握在了节点也就是 VOC 用户的手里。

同时,通过 DPOS,VOC 语音链能够实时监测网络的健康状况,检测每一个代表者是否按计划依次生产了区块,避免双花的产生。借助 TPOS,VOC 的每一笔交易都可以选择性地包含最近一个区块的哈希值,解决了主链的证明问题,确保了交易历史的长期完整性。

总的来说,DPOS 使得 VOC 能够在保证去中心化的基础上应对延迟和吞吐量不足的问题,解决了性能与安全之间的矛盾,并使 VOC 语音链容忍拜占庭错误。相比于 POW、POS 等共识机制,DPOS 最好最高效也是最大限度地地帮助 VOC语音链实现了去中心化,让语音链真正面向全球。

2.数据层

RSA 加密与解密机制:

为了确保 VOC 用户权益中真正得到保障,我们使用了 RSA 加密与解密方案来实现 VOC 内容版权确认。

VOC 平台通过 KeyGen(密钥生成算法)、 Encrypt(加密算法)以及 Decrypt(解密算法)三大算法实现了 RSA 公钥加密体制的建立。内容加密也相应地要经过密钥生成、内容加密、内容解密三大过程。

首先是密钥生成。新内容生成时,VOC 平台就会将某个安全常数 M,输入KeyGen 算法。随后,经过随机选取质数、欧拉函数计算以及模反元素计算等一系列过程后,VOC 最终得到公钥 PK 与私钥 SK。随即,私钥将通过 SHA256 哈希算法和 Base58 转换,形成 50 个字符长度易识别和书写的私钥被分发给内容生产者。

随后是内容加密。VOC 通过已有公钥 PK 与 Encrypt 对内容 P 进行加密。Encrypt在得到公钥和内容后输出密文为 CT。CT 作为信息打包进入语音链,进行传播与存储。

最后是内容解密。在 Derypt 支持下,私钥持有者通过对应私钥 SK 对密文 CT进行解密,得到明文 P,提供给内容需求者。

新内容通过 VOC 平台生产完成时,VOC 平台随即产生公钥对内容版权进行加密。同时,VOC 将解密用的私钥分发给内容生产者。在 RSA 体制下,仅仅只有私钥持有者才可以对该部分内容版权进行解密。也就是说,持有私钥就相当于拥有了该部分内容的版权。同时,VOC 平台会对公钥与私钥进行合理的管理,确保用户权益不受侵害。

同时,VOC 让作者直接在链上工作,把单一时间戳汇成时间段,写入 VOC 语音链,进而避免元数据单一无法佐证,有效打击了盗版内容。并且 VOC 也将运用多私钥加密技术,以满足多重签名等更为灵活和复杂的场景。

总的来说,VOC 语音链通过 RSA 加密与解密机制,实现了版权确认的具体化。后期 VOC 内容产生的收益就会主要根据私钥持有来进行分配,从而打破中心化公司掠夺利润的不公平局面,真正做到“数据来源于用户,利益归于用户”。

3.网络层

分布式文件系统 IPFS:

为了在满足数据快速传输需要的基础上保障 VOC 语音链数据安全从而切实维护用户权益,我们决定采用分布式存储重要信息与中心化存储冗杂信息相结合的存储方式。

鉴于 VOC 语音链需要留存的资料繁多冗杂、体积庞大,且未来节点将以移动终端为主体,为了保证节点与网络正常运行,维持网络较快的数据传输速度,避免网络延迟对 VOC 语音链造成影响,我们将重要的见证信息、使用权限等重要数据与大量的语音数据分离开来。对于重要公证信息、使用权限等语音上链内容我们选择进行运用 IPFS 星际文件传输系统进行分布式储存,而对于大量语音数据则 VOC 则将其存储在中心化服务器上。

对于使用权限、公证信息等重要信息,IPFS 星际文件系统首先通过 S/Kademlia方法生成对等节点身份信息,使每一条信息都会被赋予一个独特的哈希值,作为其认证的唯一指纹,提高安全系数;随后,IPFS 通过任意传输层协议,实现 ICE NET&NAT 穿透,使得重要信息在调用时能够在网络间极速传输;同时,IPFS 将会使用类似 Git 版本的控制文件系统,让每个节点使用保存不同版本的所有文件,达到 VOC 语音链重要信息永久保留的效果。也就是说,IPFS 使得 VOC 语音链的重要信息同时保存在了所有的节点上,并赋予了其独特的身份认证,也仍然允许了重要信息的快速调用。通过这一点,VOC 语音链切实有效地将权力与利益放到了用户手中,VOC 语音链的控制权被牢牢地掌握在了所有用户的手里。

而由于 VOC 语音链的特殊性,VOC 每天必须接收并分发大量的文字、语音等格式的数据。这部分内容繁多冗杂、体积庞大。如果要让所有节点都接收并存储这部分内容是不现实的。盲目将这部分内容上链,也将对 VOC 网络运行速度造成极大地拖累。因此,不重要的文字、语音等数据在传输时,就将 VOC 平台作为中转站,由 VOC 平台负责接收与分发。同时,这也有助于 VOC 平台形成一个庞大的开放的语料库,能够对 VOC 以及其他智能语音开发公司形成极大的帮助。VOC 平台也将承诺建立高效的服务器对这部分信息进行存储。

可以说,分布式存储与中心化存储相结合的存储方式是最适合 VOC 语音链的存储方式。既能保障重要信息的安全,又能兼顾普通信息传输的快速;既能保障用户权益,又能帮助建设语料库。VOC 语音链将在很长一段时间内两线并行,努力做到我们的宗旨,即建设最大的去中心化语音资料库。

4.激励层

语音挖矿激励:使用 VOC 分布式应用进行语音挖矿,每成功上传一次语音并审核通过,即可获得相应的 VOC 代币奖励。

任务挖矿激励:完成 VOC 内的指定任务,如加入社区、关注公众号等即可获得VOC 代币奖励。

5.后期技术支撑——发展公有链

公有链是指全球任何人都能发送可确认交易、随时进入系统读取数据、都能参与到共识形成过程的区块链。共识过程决定在区块链上可以添加那个区块,并决定现有状态。所以公有链通常被认为是“完全去中心化”的。

公有链的特点:

·受到加密经济的保护:公有链被经济激励和加密图形验证相结合的加密经济所保护,用类似权益验证或者工作量验证的机制,遵循人们影响共识形成的程度和他们能够支配的经济资源数量成正比的总原则。

·所有数据透明公开:尽管在区块链中的参与者选择“非实名”,用来隐藏自己的真实身份是件再平常不过的事,但在任何节点中都可以查询到其他人的账户余额以及交易活动。

语音链后期将发展公有链技术,开发钱包,使更多愿意为智能语音行业做贡献的人参与到 VOC 生态中,并以此为基准,搭建多元化的语音数据入口,消除行业壁垒,实现语音行业的全球化。

语音链(VOC)基于区块链技术的语音人工智能训练系统

VOC 语音数据生态的应用场景

1.落地 Dapp —— 在线语音挖矿平台

为了将 VOC 的思想真正落实,做到数据原值不可改,数据沉淀可确权,数据交易可追溯,数据收益归用户,VOC 语音链以智能移动终端为载体,基于区块链底层技术,搭建分布式、去中心化的在线语音挖矿 app —— VOC。

VOC 是一个线上语音挖矿平台,所有用户可以灵活选择采集语音资料和审核语音资料两种挖矿方式。同时 VOC 将为采集语音资料的内容创作者提供确权服务。在挖矿过程中,VOC 将为用户实时更新任务信息,提高完成任务的效率。挖矿结束后,VOC 也会对用户持有的 VOC 代币进行加密保护与妥善管理,并提供提现等一系列服务。

·权利方面,VOC 基于区块链技术,将应用直接运行在分布式网络上,完全开源、自治。权利回归于用户手中,没有人能掌握 VOC 100%的控制权。

·安全方面,VOC 将版权等重要信息加密后通过 IPFS 储存在 VOC 语音链上,保障相关信息安全。

·交易方面,VOC 也拥有自己的代币,VOC 代币。节点维护者、内容生产者、内容审核者都将会获得代币作为奖励。VOC 代币通过国际先进的加密算法进行保护。并且 VOC 也会将所有交易信息直接上链,公开透明,安全性高。

灵活性方面,为了提高 VOC 运行灵活性,我们也将同时运用 Modifiers(函数修改器),实现对应用牵涉到的智能合约进行管理、增发、兑换、冻结等操作。同时 VOC 也能够在大部分用户达成共识后根据用户的反馈及要求对应用进行升级。

2.打造方言社区,保护濒危语言

语言,是文化的载体,是传播的工具。语言的多样化,意味着人类多元的文化和人文生态得以传承和保持。语言的保持和流传,不单是表达和文字的珍贵传承,更是文化和人文生态的继续和繁衍,这是语言的魅力,也是语言的价值。一种语言的灭绝,就意味着一种曾经蓬勃的文化消失了,一个信息的源头枯竭了,一份历史的遗产湮灭了。

联合国教科文组织表示,截至 2013 年,每两周就有一种语言消失,超过很多动物的灭绝速度。中国知名学者周海中也曾经指出:一些民族语言正面临着全球化、工业化、互联网等的冲击,正处于逐渐消失的危险,有关部门、机构以及语言学界都应该采取积极而有效的措施来保护弱势的民族语言和抢救濒临灭绝的民族语言。这样既有利于人类文明的传承和发展,也有利于民族团结、社会安定VOC 语音链的诞生将为濒危语言的保护提供一个绝好的途径。

基于区块链与大数据技术的 VOC 语音链有着数据不可更改和永久保留的特性。濒危方言的使用者使用VOC 语音链进入方言社区时,通过 IPFS 存储以及RSA 非对称加密技术,他们所有的语音数据都将被永久保留并且不会出现任何错误。这样一来,就算现实生活中的使用者消失殆尽,我们也还可以用这部分语音数据来进行方言的教学与传承,真正让这些方言永久保留,不至于让人类宝贵的文化之珠蒙上灰尘。

部分方言面临濒危的另一重要原因是,使用者常居于偏远地区,经济状况落后,在需要与外界进行交流时必须放弃方言。这也导致年轻人不愿再使用方言,而是去学习其他使用人数更多应用更广泛的语言。于是乎,提高濒危方言使用地区的经济水平也将有利于方言的保护。

VOC 语音链在帮助方言使用者留存语音资料的同时也给予了方言使用者代币。因此,对偏远地区的方言使用者来说,使用 VOC 语音链进行挖矿也将会是一个获得经济收入的有效途径,尤其是对部分失去劳动力的方言使用者来说更为重要。像年过花甲的老人,拥有极为丰富的方言知识同时无法再通过劳动获取收入。他们在学会使用 VOC 语音链进行挖矿后,不仅能取得稳定的收入,还能为建立方言社区做出贡献。VOC 语音链也将借此推动偏远地区人民早日脱贫,拥抱小康生活。

同时,VOC 语音链也可以在地方政府申请“方言”非物质保护遗产工作上提供帮助,地方政府只需要利用 VOC 代币,向平台申请定制化的方言语音收集,平台通过特殊任务形式发布语音挖矿任务,即可收集到完整且针对性强的方言语音数据。这样不仅会使地方省去采集时需要的大量人力与物力,还同时使得 VOC语音链参与到方言保护、方言存续的重大使命上,加强方言语音录入者的自我认同感。

3.打造“去中心化”语音社交生态

随着语音社交的崛起,“去中心化”和“平民化”已经成为了语音社交产品最显著的特征。VOC 语音链计划将接入互联网商业形态中极具价值的语音数据流入口,如语音聊天社交类、语音电台类、语音直播类、唱吧 KTV 类、有声书籍、在线语言教学类等等。VOC 开放的产品特性,会使 UGC(用户生产内容)成为平台最主要的最主要的内容来源,从而避免 PGC(头部生产内容)的现象出现,搭建“去中心化”语音社交生态。同时这种特性将打通更多维度的语音数据,并同时形成多元且规模化的语音数据价值效应,让个体与各类语音应用在 VOC 生态中,获得多种形式的声音数据价值变现渠道与方式,实现个人更多的价值回报与收益。

用户还可对感兴趣的内容进行 VOC 代币打赏,使得 VOC 代币成为主要的流通货币,助力 VOC 语音社交生态的发展。

4.重要信息上链

现实生活中许多场景下,语音资料的留存能够对用户的权益保护起到一定,比如商业交易当中的重要口头信息,犯罪场景下的对话记录,如果能留存下来都能够对用户的经济、人生安全等权利起到一定的保护作用。

而基于区块链技术的 VOC 语音链平台就能够为用户提供该部分重要信息永久留存与来源确认服务。当用户需要相应服务时,运用 VOC 语音链平台采集相关语音资料的同时支付一定的 VOC 代币作为服务费用,VOC 平台就会借助 RSA 加密与解密机制让用户持有对应解密私钥以达到确认语音资料来源的目的,同时VOC 平台也会通过 IPFS 星际文件系统将该部分发送至每个节点,即重要信息上链,实现重要信息的永久留存与不可篡改。VOC 平台通过为用户提供这样的重要信息上链的服务,既有效利用了 VOC 语音链的区块链特质,创造了社会价值又切实维护了用户的权益。

5.无差别翻译系统

VOC 语音链将利用搭建的语音数据库,结合人工智能技术,打造全球化无差别翻译系统。使用者在录入语音时,不需选择输入语种,无差别翻译系统即可通过大数据检索,AI 自动识别语言,就可以精准地翻译出所需的输出语言。这样就避免了使用者因知识量储备不足,无法使用传统翻译系统的困境。

6.构建语音交流工作站

在平日工作时,我们常会遇到领导发送的多条 60 秒语音工作安排,不但需要浪费很长时间聆听记录,还没法对未听清的部分选择性听取,即使选择文字翻译,也只能对语音前部分进行翻译,对此不少用户头疼不已。

而 VOC 语音交流工作站在用户发送语音的同时,就在传输过程中利用 AI 对字节进行识别,进行语音精准翻译,接受者会同时收到语音和文字,同时可对语音进行时间选取。这样会非常高效率的提高工作交流,并且会让用户对此功能产生粘性。

7.智能语音交互平台

随着“现象级”产品亚马逊 Echo 音响迅速抢占市场份额,各大巨头如苹果、谷歌、微软等纷纷布局智能语音平台,开始研发自己的智能语音技术,抢占最新人机交互入口。

VOC 凭借强大丰富的语音数据库,结合人工智能语音书别技术,可以打造出智能语音交互平台,凭借更符合人类自然交互的语音对话模式,迅速切入各个行业的核心业务,提高传统行业效率,融合传统行业各个组成。未来会选择与智能家居行业合作,打造出属于 VOC 语音链自己的智能语音音箱。

VOC 的经济模型

VOC 平台针对某种语言场景征集语音数据,流程如下所述:

首先,VOC 平台向能够采集语音资料的用户发布任务文字信息,用户完成任务后,上传语音数据,VOC 平台将利用后台审核机制对语音进行初步审核,并对通过审核的数据随机抽样,所得抽样数据交由多名专业人员同时审核,每位审核员需反馈结果。完成数据录入,VOC 平台随即将任务奖励 VOC 代币分发给内容生产者和内容审核者。同时,VOC 平台将使用权限、版权确认等重要信息上链进行分布式存储,将语音数据上传至中心服务器。一旦有他人想要使用该部分语音数据,必须提供一定数量的 VOC 代币进行交换,并由 VOC 平台分配给版权所有者。

语音链(VOC)基于区块链技术的语音人工智能训练系统

1.获得 VOC 的途径

·通过第三方交易所交易
用户可以通过交易所,以实时公布的价格达成 VOC 的交易,交易自己的VOC 持有量。

·在 Dapp 中进行语音挖矿
在无特定任务情况下,用户能够通过 VOC 语音链平台进行挖矿获得 VOC 代币。用户只需要针对随机出现的文字信息进行语音资料采集或者针对随机分配的语音资料进行审核即可。

·平台激励

平台激励包括糖果激励、内容生产激励、内容审核激励和平台建设激励。

①糖果激励:注册即送 VOC,邀请好友再送 VOC 等活动以及平台其他相关活动奖品的分发,以促进 VOC 平台更加快速的发展并最终实现 VOC 平台的宗旨。

②内容创作激励:用户合格地完成语音资料采集任务并予以上传后,将获得VOC 作为激励。这是最主要的激励方式之一,能有效激励用户采集语音资料完成任务。

③内容审核激励:用户对未审核语音数据进行审核并形成意见后,将获得VOC 作为激励。这也是最主要的激励方式之一,能够促使用户在无法采集相关语音资料的情况下参与到 VOC 平台任务的完成中来。

④平台建设激励:通过选举,有资格维护平台网络正常运行,打包区块并实际履行了责任的用户将获得 VOC 作为激励。这将保证 VOC 平台在健康的环境下进行高速发展。

·版权确认流通收益

版权确认流通收益是指在内容生产者通过版权确认成为该部分内容的版权所有者以后,他人为使用该部分内容支付一定数额的 VOC 时,内容生产者将获得大部分 VOC 作为补偿,VOC 平台抽取小部分作为流通手续费。此举可以切实保护用户的版权,从根本上有效地激励了内容的创作。

2.消耗 VOC 的方式包含但不限于

·平台中数据调用
平台中数据调用消耗是指非版权所有者在使用特定内容时,需向平台支付一定数额的 VOC 作为代价。这将为版权确认流通收益提供基础条件,促进平台良好发展。

·自媒体平台优秀内容打赏
用户可以用持有的 VOC 代币对喜欢的自媒体内容进行打赏,以激励自媒体内容生产者创造出更多更好的内容,促进社区健康良好地发展。同时还可以在 VOC 代币的流通过程中,让用户更好的发掘出 VOC 代币的使用价值。

·定制化语音数据服务
当用户需要相关语音数据,却无法在 VOC 语音链数据库中找到时,用户可以用支付 VOC 代币的方式,借助 VOC 语音链平台发布相关文字信息,召集内容生产者与内容审核者上传并审核语音数据,以满足需求。

·重要信息上链服务
用户可以支付 VOC 代币来获取 VOC 平台提供的重要语音上链服务。当用户有商业交易当中的重要口头信息,犯罪场景下的对话记录等重要语音信息需要录入并永久存储时,用户在向平台支付一定的 VOC 代币作为费用之后就可以使用相关服务,将 VOC 语音链作为保护自己的权益的有效工具。

·权益类功能(举报、提出 gas 费用等)使用
当用户行使举报、提出 gas 等特殊权利时,需要支付一定 VOC 代币作为费用,以避免用户恶意行为对 VOC 语音链平台造成危害。

当 VOC 在平台内的流转过程中,平台会适时收取适量的服务费用进入收益池。该部分 VOC 将会定期定量返还到平台激励池中。这一抽取补偿机制的设定将会促进 VOC 平台经济的正向循环更加积极。

关于更多VOC信息:http://www.vocalchain.io/

更多区块链项目:http://www.qukuaiwang.com.cn/news/xiangmu
风险提示:区块链投资具有极大的风险,项目披露可能不完整或有欺骗。请在尝试投资前确定自己承受以上风险的能力。区块网只做项目介绍,项目真假和价值并未做任何审核!

声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

发表评论

登录后才能评论