当前位置:科学 > 正文

把你的IPhone变身超级AI语音智能助理

2023-02-19 16:59:27  来源:肥崽之父

在手机上对话ai,语音对语音,或者文字对聊,嗯,今天我就来教你们怎么做。我们今天要做到什么效果呢?直接通过语音来对接openai的AI语言模型并且让结果用语音读出。IPhone的快捷指令功能非常强大,但是好多人从来没用过。


(相关资料图)

快捷指令

在你的Iphone手机上搜索快捷指令,打开它,在打开的界面上方有个加号点击它就可以创建属于你的快捷指令,你跟着我按照步骤一步步来,就可以在你的手机上实现最酷的ai访问方式

点击加号创建快捷指令


打开的创建界面是这样的


接下来我们就要不断的添加操作哈,一步步来,第一步我们要添加输入方式,我们现在希望是语音输入那么我们就点击这个添加操作呢它又会进入这个操作的搜索界面

操作搜索

通常呢你在顶部的搜索框进行搜索操作就可以了,下面是操作的分类啊啥的,你有兴趣以后可以自己慢慢研究,我们现在要添加听写文本操作,那么我们搜索一下

搜索操作

看到了吗听写文本,就是它,点击添加那么我们的第一个操作就添加好了


第一个操作添加完成

在这个操作右侧呢有个小箭头点一下是这个操作的相关配置在这里呢我们不需要修改后面有的操作我们需要输入很多的参数我们就先了解一下。


操作的展开是其详细配置

第一个操作的添加我们说得比较细后面呢我们就一笔带过了哈,大家有啥情况可以在评论区交流,启动这个快捷指令以后我们第一个操作呢是听写文本,那么拿到文本以后呢我们要通过http请求提交给openai,然后呢这个网络请求的结果呢我们要分析它从它的返回结果里面拿到我们想要的文本内容,http的请求呢是post请求这个太专业大家不需要关心我就这么一说,它返回的结果呢是json格式,我们要的结果呢在第二层,所以我们用两次查找字典的方式从返回结果里拿到最终值,拿到这个回答的文本以后呢我们把它交给朗读文本操作,这样整个流程就算跑完了。下面我们就来一步步加,解释重点放在参数上,首先我们来定义一个url操作,就是openai的api访问地址 https://api.openai.com/v1/completions ,来我们添加一个URL操作并且把网址填进去

添加第二个项目

好了我们现在添加了两个操作,接下来我们要用这个url去获取URL内容,嗯好的找到“获取URL内容”操作添加它,通常添加完毕它已经自动选上了我们前面定义的url操作,这样就关联起来了,这个操作是重点,我们有很多的参数要配置

展开参数

点击小箭头我们展开参数首先呢要把方法改成POST,然后呢我们展示一张配置完成的图你们看看


需要配置的所有参数

下面对参数做一些详细的介绍

方法 POST

头部 Content-Typeapplication/json

AuthorizationBearer 你的apikey 填这里

请求体 model text-davinci-003

prompt 参数选你前面的文本听写操作

max_tokens 500

top_p 1

frequency_penalty0

presence_penalty 1

temperature 1

上边列出了具体的参数,你们对着图来填就行了,不需要加引号,请求体里面这些参数是openai的要求参数

Content-Type是请求的数据内容类型

Authorization这个是重点我们openai里面创建的apikey就通过这个参数传给api作为访问授权,Bearer空格后面跟ApiKey,ApiKey在openai账号里是免费创建的创建方法自行百度了,百度有的我就不说了,很简单的,你们有什么搞不定的在评论区里问。

model是模型名称这里填的是达芬奇003,是api里最牛的,据说chatgpt的测试模型也在api里神出鬼没但是因为不稳定先不管他,等他稳定发布以后你可以填上chatgpt的模型名称,

prompt呢是你的提问文本,这里我们要指向前面的听写操作结果,

max_tokens呢是最大返回结果数,你可以理解为返回多少单词就好,达芬奇我记得最大是可以放到2048个token的,你只要不超过这个数都可以,理论上500可以省点费用万一结果不是你想要的那么就此打住,openai的api是按token来计费的,如果你们是免费换号玩家当我没说,按最大的整。

top_p ,frequency_penalty ,presence_penalty ,temperature这几个值你们自己去查吧我就不在这里扯了对我们今天的实现影响不大,而且本来他们有的应该要填小数的操作输入的数字只能填整数我就都填1了,这些细节你们慢慢了解慢慢优化吧,我就不啰嗦了,我们继续

在完成这个内容请求操作之后我们就要对结果进行处理了,通常请求之后返回的是一个json,但是这个json返回体里面的很多东西我们都不想要,所以我就通过两个字典取值操作来获取最终结果,你们跟着我的步骤来就行了,首先添加一个获取词典的操作从我们刚才的url内容中获取词典,这个词典其实就是返回的json数据

添加获取词典操作

大家按照图中的来哈,搞不定的自己琢磨一下,或者在评论区交流一下,获得了这个词典以后我们再添加那两个取值的操作获得我们最终的请求返回文字文本,过程就不细说了就是添加操作以上一次的结果作为下一次的参数

添加两个取值操作获取text

好的经过在结果json里的两次查找第一次找choices值,第二次找text值,我们拿到了本次api调用的文本结果,那么接下来我们只要把这个结果朗读出来,这个快捷指令就完事了,最后来添加一个朗读文本操作吧


全部操作添加完成

至此这个快捷指令的操作就已经全部完成, 点击右上角的完成就保存退出。然后我给他起了个名字叫智能助理,这个改名操作只要长按你创建的快捷指令就会出来一个菜单上面有改名

可以重新命名你的快捷指令

起什么名你们自己开心就好。这个呢是一个语音输入到语音输出的快捷指令,启动它的方式有很多种,用手指点,用siri唤醒,打开语音控制设置可以直接呼叫智能助理唤醒,在我的手机Iphone11上那个文本听写似乎有点问题,它只有在siri唤醒的时候是正常的,其他的都是一闪而过,但是siri唤醒需要两次唤醒词第一次 hi siri 接着说智能助理,感觉很蛋疼,打开语音控制是最好的。只有一次唤醒,但是不知道我机器上的表现是不是一个普遍的bug,你们可以在评论区告诉我。

最后我要说一点,开始的文本听写操作和最后的文本朗读操作都是可以替换掉的,换成请求输入操作,和显示结果操作,这样就变成了一个文本问答,你可以在手机上输入文本问题,快捷指令会给你显示文本回答,当然你也可以做各种组合,我这里就给你们展示一下不同的配置方案,你们后面自行发挥了,总之快捷指令其实还有N多的东西值得你们去挖掘


一种纯文字的方案,点击快捷指令输入文字回答文字


提问


回答

好了,今天的分享就到这里了,你们如果还玩出什么花来也欢迎在评论区里分享,如果你觉得有用欢迎点赞,评论,转发

关键词: 人工智能 JSON iPhone 语音识别技术 2019科技之光 列奥纳多·达·芬奇

推荐阅读

发展可再生能源是为什么 发展可再生能源有什么意义?

不可再生能源在自然界已经形成了上亿年,短期内无法恢复。随着大规模开发利用,储量越来越少,总有一天会枯竭。那么,什么是不可再生能源, 【详细】

中国面积最大的湖 中国面积最大的湖排行榜前十名

青海湖是中国最大的湖泊,总面积4456平方公里,周长360多公里,著名的太湖因为面积不到它的一半而显得微不足道。接下来,小编将带你了解中 【详细】

青铜神树是什么 三星堆文物青铜神树是什么?

三星堆文物与《盗墓笔记》描述相符,三星考古发现引起了广泛的关注。金面具残片、鸟形金饰、金箔、彩绘铜头眼、巨型青铜面具、青铜神树等50 【详细】

盐亭发现超大储量油气田 四川盐亭发现超大储量油气田是真的吗?

随着城市化进程的不断推进,成正在成为天然气,的宝贵资源,这也是中国早些年启动西气东输项目的原因之一。中国有许多能源型城市,如以煤炭 【详细】

红旗无人驾驶汽车有消息吗?红旗无人驾驶汽车是否已经生产?

红旗无人驾驶汽车有消息吗?之前和百度所牵手的,如何了?在百度举行的2018年世界大会上,百度宣布将与一汽集团合作生产Apollo红旗, L4级无 【详细】

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有