Caps Writer(语音输入工具)特色
● 利用"大写键"来启动语音输入
● 用户能够自定义使用自己所需要的API
● 开源并且没有广告
Caps Writer(语音输入工具)源代码使用
keyboard (用于监听键盘输入)
pyaudio (用于接收录音)
PySide2 (图形界面框架)
aliyun-python-sdk-core (阿里云 sdk)
alibabacloud-nls-java-sdk (阿里云智能语音引擎 sdk)
其中:
pyaudio 在 windows 上不是太好安装,可以先到 这个链接 下载 pyaudio 对应版本的 whl 文件,再用 pip 安装,Mac 和 Linux 上需要先安装 port audio,才能安装上 pyaudio
alibabacloud-nls-java-sdk 是指阿里云官方 java sdk 的 python 实现,它不是通过 pip 安装的(官方没有上传到 pypi ),而是通过 阿里云官方文档的方法 进行安装。
其它模块使用 pip 安装即可
本文件夹内有一个 安装指南 文件夹,在里面可以找到详细的安装指南,还包括了提前下载的 alibabacloud-nls-python-sdk 和 pyaudio 的 whl 文件。
Caps Writer(语音输入工具)注意事项
在主页面选择一个引擎,点击启用按钮,就可以进行语音识别了!
启用后,在实际使用中,只要按下 CapsLock 键,软件就会立刻开始录音
1、使用语音识别时: 如果只是单击 CapsLock 后松开,录音数据会立刻被删除; 如果按下 CapsLock 键时长超过 0.3 秒,就会开始连网进行语音识别,松开 CapsLock 键时,语音识别结果会被立刻输入。
2、因 Caps Writer 2.0 内置了对阿里云一句话识别 API 的支持。如果你要使用,就需要先在阿里云上实名认证,申请语音识别 API,在设置页面添加一个语音识别引擎。如果不会可以点击帮助按钮进行观看。
3、阿里云注册后可免费试用 3 个月,之后需要付费使用。