毕业论文-基于IOS平台的语音智能应用--毕业论文.docx
《毕业论文-基于IOS平台的语音智能应用--毕业论文.docx》由会员分享,可在线阅读,更多相关《毕业论文-基于IOS平台的语音智能应用--毕业论文.docx(25页珍藏版)》请在咨信网上搜索。
1、河南师范大学本科毕业论文河南师范大学成人高等学历教育毕业论文题 目 基于IOS平台的语音智能应用 指导教师(签名) 目录摘要2Abstract3一、绪论41.1开发背景41.2研究现状41.3语音智能的意义41.4主要工作6二、系统需求分析72.1系统开发所需的硬件条件72.2系统开发所需软件条件7三、系统界面设计83.1系统设计标准83.1.1整洁性83.1.2易读性83.1.3实用性83.2 UI绘图设计83.2.1语音识别界面设计83.2.2语义理解界面103.2.3语音合成界面103.2.4语音唤醒界面123.3整体设计风格13四、界面及功能实现的关键技术144.1语音识别界面144.
2、2语义理解界面154.3语音合成界面164.4语音唤醒界面17五、系统的整体测试及性能优化185.1测试工具185.2开发时需要注意如何避免一些性能问题18六、总结20参考文献21致谢22基于IOS平台的语音智能应用摘要语音智能在互联网智能迅猛发展的浪潮中,是一朵璀璨的浪花。人类社会发展经过互联网这一里程碑式的革命,已发生翻天覆地的改变。人们为寻找下一个迅猛发展的契机,仍然不懈摸索前行。语音智能作为其中的一个发展方向,被众多科技公司青睐,随着时间发展,一个又一个技术难关被攻克,智能语音技术越来越成熟,随之应用范围也越来越广。关键词智能语音,界面设计,语音识别Based on the IOS p
3、latform voice smart APPAbstract Intelligent voice, in the tide of rapid development in artificial intelligence, is a shining waves. Human and social development through the Internet revolution of the landmark,great change has occurred. People looking for the next opportunity of rapid development, st
4、ill unremitting feeling. Speech intelligence as one of the development direction, by a great number of technology companies, with the time development, one after another technical challenges have been overcome and intelligent voice technology is more and more mature, with the range of application is
5、 becoming more and more widely.Keywords intelligent voice; interface design; speech recognition一、绪论1.1开发背景语音助手也许是移动互联网时代最强势的工具,或将得到非常快速的普及推广应用。我们可以进行一些比较深入的探讨。移动互联网在人类社会发展中占据举足轻重的地位。未来人类生活的方方面面包括文化新闻讯息社交经济金融等都将在一部移动终端上完成。互联网可说是一个巨大的金矿,谁能抢占到先机,谁就是最大赢家。手机、平板等移动设备在方便用户的同时,缺点同样明显,由于屏幕太小的限制,导致阅读起来比较费劲,尤其
6、是中老年人群。而且,还有一个很大的拦路石,那就是移动网络消耗大量流量造成的费用过多问题。语音则不同,它有很强的兼容性。戴上耳机,不管你是在地铁,还是火车站机场里;无论你是在公园遛弯,还是在星巴克喝咖啡,都可以随心所欲接收新闻资讯社交信息,只要你所处的环境有信号。毋庸置疑智能语音有利于所有人的出行和生活。1.2研究现状2016年,语音识别行业频频传出喜讯。在老罗主打情怀的锤子手机的发布会上,科大讯飞却成了最大的赢家,准确率高达97%的语音识别,引起一票网友和媒体的关注,原来在人们不经注视的某个时间,我国的语音识别已经如此前沿。前瞻网上也有相关报道锤子手机发布火的却是讯飞语音。不久后,搜狗科技第三
7、季度的报表显示,他们的语音识别准确率在97%以上,看似与科大讯飞摆擂而战。一众媒体自行测试分析,发现搜狗的语音识别的确有与科大讯飞一较高下的资本。随后,微软的语音识别也有新突破。微软科学家用时一个月,将英语的语音识别错词率从6.3%降到了5.9%,超越了当前人类所达到的水平。1.3语音智能的意义当前,智能语音相关产品在市场是越积越多,随着各大公司投入成本大力推广,智能语音在不知不觉中已充斥人们的生活中。如智能家居、智能保安、智能车载系统以及人工智能等。智能语音系统大致可以分为三大类,分别为生活智能、企业智能和人工智能语音系统。生活智能语音系统随着科技的发展,人们的生活越来越追求智能化,也慢慢被
8、智能所包围,像智能化家居产品、智能化的硬件设施以及各种智能化的应用等等。通过房间主人的声音,根据住户的要求调整室内的灯光强弱,控制家用电器的开关。美的海尔等家电企业也不甘示弱,纷纷推出空调语音控制功能,让人们从此远离遥控器。电视领域也接连发力,乐视、长虹、海信等企业推出语音控制电视,彻底脱离遥控器的束缚,直接用语言说出你的要求,就能达到更换频道、开关机等目的,大大方便了人们的生活。车载系统、智能门禁系统、智能安保系统的应用都属于生活智能语音的一部分。2016年6月,研究车载系统的出门问问向市场发布了他们的第一款车载机器人“问问魔镜Ticmirror”和ADAS高级驾驶辅助系统“问问魔眼Tice
9、ye”。尽管在一些微小的差别现有的车载语音还不能百分百识别,但我相信在科技发展迅猛的今天,语音识别技术的不断完善后,科幻小说中的场景终将变成现实。企业智能语音系统中国的社会,自古以来就是人情的社会。但在企业纷纷用上智能语音系统的今天,就算电子音可以提供24小时的服务,仍然让人察觉不到丝毫人情味,但无法否认,在企业智能化应用中,智能语音系统恰恰是得到广泛使用的。这些仅仅是其中的冰山一角而已。以阿里巴巴为例,2015年起,阿里集团与蚂蚁客服接听的每一个电话,都会触发一个叫风语者的系统。人工抽样检查只能做到千分之三的样本质检,而这个系统利用自动语音识别技术,将声音转换成文字,能够实现为百分百的自动检
10、查,节省几百倍的人力成本。将来数据库经过不断的更新补充,那么,智能语音的能力也将不断提高,客服售后等环节完全可以由智能系统代替。会说话的人工智能人工智能,人类创造的智能交互的通信软件和硬件,可以使人工智能更生动和人类沟通,大部分人工智能都离不开智能语音系统。这其中包含baidu语音助手、微信语音助手等。人工智能也可以称为私人语音智能助手,他可以有一个具体的形态,也可以仅仅是系统中的一个应用。重点是它可以沟通交流,可以为使用者提供所需的信息内容。在理想状态下,人工智能可以根据用户的个人习惯来代替用户发出部分命令,比如坐到沙发上主动打开电视。1.4主要工作此次所做的项目是基于IOS的手机App,名
11、字是“聊一聊”,它的基本功能,包括语音识别,语义理解,语音合成,语音唤醒四个功能。本次论文对“聊一聊”的开发背景,开发目的,系统需求,界面设计以及功能实现和性能优化进行了简单的介绍。本文的第一部分主要介绍了基于iOS系统的手机App“聊一聊”的开发背景,现状研究,开发意义和主要工作。第二部分主要介绍了系统开发软件和硬件需求,并具体分析了iOS系统的一些开发特点。第三部介绍了关于手机App “聊一聊”的界面设计,然后详细介绍了系统绘图标准和UI界面设计。第四部分介绍页面布局设计的实现模块功能。第五部分介绍了系统的整理测试和性能优化。第六部分总结了智能语音的发展历程。二、系统需求分析2.1系统开发
12、所需的硬件条件开发阶段需要的开发工具:苹果公司的Macbook air、Macbook pro、iMac,必须安装Mac OS X 10.11以上版本的操作系统,运行内存最好是4G以上。 开发完成后需要真机测试,真机测试需要iPhone手机,我们使用的是iPhone6进行的测试。2.2系统开发所需软件条件本次开发所需软件条件为Xcode 7.1工具,Swift 2.1语言版本,iOS 8.0系统。Xcode适用于开发OS X和iOS应用程序,它支持Object-C、C、C+、Swift等多种编程语言。Xcode经历多个版本的迭代,从Xcode1.0到Xcode6.3,直到现在的Xcode 7.
13、1、 Xcode 7.2。本次开发所用的就是Xcode 7.1版本,必须注意的是由于使用了某些迭代之后的代码,Xcode 7.1版本之前的Xcode 并不能运行本项目。“Swift是苹果公司在2014年发布的新语言,可以与Object-C共同运行与Mac OS和iOS平台,用于搭建基于苹果的应用程序。Swift是一款易学易用的编程语言,且它是与脚本语言拥有同样的表达能力和趣味性的第一个系统编程语言。Swift的设计以安全为出发点,以避免各类常见的编程错误类别。”Swift相对于Object-C比较来说,Swift的语法比较干净,Swift的API比Object-C更容易阅读与维护,推断类型使得
14、编写的代码更干净,不容易出错,模块消除了头,还提供命名空间。内存仍实行自动管理,甚至都用开发者输入一个分号。使用Swift更加安全,更加简单,并且高效率功能强大。三、系统界面设计3.1系统设计标准3.1.1整洁性App发展,已经从最初完整性的追求转为如今的提高用户体验,这个过程从根本上提升了App的整洁性。整洁性指的是要求设计师在构思App框架的时候就要考虑到用户的操作习惯和审美体验。一个整洁的App界面影响且决定了用户的体验效果,可以提高App的“评分”。整洁的App才能获得用户的好评。3.1.2易读性易读性指的是用户拿到App时,能够迅速适应各项功能且即时准确的了解这款App的适用范围。如
15、果把各项功能做成隐蔽性的,那么用户想在这款App中得到的某项需求就不能得到准确定位。App界面就算做的再精致完美也只是一个空瓶子,更不要说实用性。而用户不能找到自己想要的,那么这款App也就失去了开发的意义。3.1.3实用性实用性顾名思义就是操作上单一高效,功能上简单稳定。App的实用性简单点来说就是,假如客户需要的是一个订餐App,如果为了得到更多的用户而去迎合所有用户的需求,在订餐App的功能上添加娱乐交友导航模块不免有些顾此失彼。整个App就会变得臃肿杂乱,其实大多数用户想要的就只是订餐而已。专注于某一个领域,不见得是坏事。3.2 UI绘图设计3.2.1语音识别界面设计进入语音识别界面,
16、如图3-1所示:图3-1单击“点击说话”按钮,出现请求说话提示,如图3-2所示:图3-2说出一段话后,通过系统后台语音识别,显示出最终的识别结果,如图3-3所示:图3-33.2.2语义理解界面进入语义理解界面,如图3-4所示:图3-43.2.3语音合成界面进入语音合成界面,如图3-5所示:图3-5点击播放按钮,即可播报所输入的文本内容,如图3-6所示:图3-6点击右下方设置按钮,可设置播放的音量、语速、语调,用来调整声音,界面如图3-7所示:图3-73.2.4语音唤醒界面当手机处于待机状态时,可通过提前设置的语音“你好小新”,使手机进入工作状态。语音唤醒界面,如图3-8所示:图3-83.3整体
17、设计风格整体设计风格选择明亮的蓝色,配以白色的背景和灰亮的辅助色,可以使界面干净而整洁,给人庄重、充实的印象。蓝色色调,最具代表性的物体莫过于大海和蓝天 ,作为冷色中的代表颜色,蓝色会给人很强烈的安稳感,同时蓝色还能够表现出平和、淡雅、整洁、刚毅等多种感觉。高彩度的蓝色主要给人营造出一种整洁高贵的印象。低彩度的蓝色营造出一种现代都市的快节奏的印象。蓝色与灰色、白色的搭配在我们的现实生活中也是随处可见的,小到服饰食品,大到城市建设自然景观,它的使用范围几乎覆盖了整个地球。四、界面及功能实现的关键技术4.1语音识别界面界面下方使用IOS最基本的控件UIButton,为UIButton添加点击事件,
18、点击UIButton进行语音识别,然后修改UIButton基本属性Layer的cornerRadius,实现UIButton的切圆角。设置UIButton的背景色及文本,实现UIButton的整体效果。当点击“点击说话”按钮之后,开始语音识别,UIButton上方的波浪线可以根据声音的分贝上下浮动,波浪线是由CADisplayLink类和CAShapeLayer类根据正弦波动公式绘制而成。识别结束后,由UITextView来展示识别结果,UITextViewDelegate方法中,特定事件发生时UITextView可以向委派方法发送信息。语音识别功能的集成需要配置SDK,首先将库放入proje
19、ct中,同时设置相关的编译参数。然后解压库文件,在开发包中, 有一个压缩文件 “pachira.zip”。需要将这个文件解压到相应的project根目录下。压缩文件“wakeup.zip”是唤醒需要的模型,需要解压将里面的两个文件直接拖入到工程里面。定义“头”文件和“库”文件步骤如下:a.进入Project信息窗口b.设置“Header Search Paths”:$(SRCROOT)/pachira/includec.设置“Library Search Paths” :“$(SRCROOT)/pachira/lib” d.在“Build PhasesLink Binary with Libr
20、aries”中加入所需要的依赖库接下来调用接口并设置参数-(void)setupWithServerIp:(NSString*)serverIp timeout:(int)timeoutconfident:(int)confidentScore version:(int)version;serverIpString是语音平台服务器的IP地址。timeoutint是语音输入最大时长。用户在语音输入界面停留时间大于这个值时,SDK会自动结束语音输入,并开始解析语音结果。单位是毫秒(ms),根据实际应用来设置最长时间。短语输入,建议值为8000ms。confident int是语音识别结果自动返回到
21、用户程序的阈值。语音平台的每个识别结果都有相应的信任度(0100之间),信任度越高,表示正确的概率越高。如果第一个识别结果的信任度大于此值,结果会自动返回;如果小于该值,结果会自动返回前五个识别结果。Version指版本号。初始化之后调用-(QianyuError) startRecording;进行录音,即开始语音识别,然后在回调方法-(void) onQianyuResultForId:(int)inputId resultCode:(int)resultCode selectResult:(NSString *) sresult selectWeight:(int) sweight re
22、sults:(NSArray *) results weights:(NSArray*) weights;中获取识别结果,用来展示在界面UITextView上,在回调方法 -(void)onPowerChange(Float32) power;中获取音量值来控制界面波浪线的振幅。4.2语义理解界面语义理解界面主要是合理的布局,最上面UITextVIew当显示框没有文字,需要展示提示内容,这个需要自定义UITextView,设置UITextViewDelegate代理,在- (void) textViewDidChange:(UITextView *)textView方法中实现提示文字标签Lab
23、el的显示和隐藏。中间三个按钮的布局需要通过计算合理的分配大小位置,并且需要适配屏幕,iPhone有三种尺寸,4寸,4.7寸,5.5寸。下方是由标签Label和UITextView混合自定义的试图,达到整体看起来像是一部分内容,这个里面使用多个控件来搭配并设置切圆角属性才能实现试图效果。语义理解功能的实现,首先初始化NLP语义理解的类,然后调用接口-(NSString*)requestNLP:(NSString*)urlIpclassName:(NSMutableDictionary *) params;传入语义理解的服务器地址和相关参数集,参数集就是上方UITextView的文本信息,返回理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业论文 基于 IOS 平台 语音 智能 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。