让我们来聊聊最近的AI热潮

由于最近工作繁忙,已经很长时间没有和大家分享一些关于人工智能的内容了。但是最近,AI领域真的是太热闹了。大家应该都知道了火出圈的ChatGPT,这是一种自然语言生成模型,它已经引起了广泛的关注。此外,GPT-4也快速地进行迭代更新。同时,出现了许多交互式聊天语言模型,有些是开源的,有些则不是。此外,SAM(Segment Anything Model)是一个刚刚发布的图像分割模型,它能够帮助你从图片中分割出你想要的任何物体,而不需要样本。这对计算机视觉产生了重大的冲击,对各行各业的影响也非常大。

许多公司都在积极地利用人工智能技术,以提高生产效率和业务创新。例如,必应搜索引擎已经接入了GPT-4,使其更加智能化。同时,Github的Copilot X也接入了GPT-4,可以辅助你写代码并提高编码效率。就连我们公司也组织了一个AIGC大赛,希望能够利用人工智能技术实现业务突破。对于打工人来说,这样的变化可能会让人感到不安。但是,如果我们能够保持积极进取的态度,不断提升自己的技能和竞争力,就一定能够应对未来的挑战。

另外,我之前曾经分享过一个名为Whisper模型的内容,并且利用它做了一个小工具。最近我对其界面进行了一些修改,并增加了一个文件语言识别的功能,如下图1-1所示。同时,我也想尝试一些新的开源有趣模型,例如VITS,这是一种声学模型,可以根据语音数据集训练出更加自然的发声模型。将VITS与Whisper和ChatGPT结合起来,可能会产生一些有趣的结果,我也会在以后的文章中与大家分享这些实验的结果。

                                                               1-1

最后,由于很多同学问过之前whisper小工具的一些问题,所以我在这里再多说一下,如果想要在GPU模式下使用这些模型,需要安装与您电脑CUDA驱动程序版本相匹配的PyTorch版本。同时,由于requirements.txt中可能存在缺少的模块,你可以根据提示自行安装缺少的模块。我也将在下面分享更新版本的应用程序,大家也可以直接下载使用,希望大家能够尝试并享受使用的过程,有问题可以联系我,期待下次再见。

链接:
https://pan.baidu.com/s/1nj174s3tyHUAsazi4tHW0g

提取码:3ugi

代码gihub地址:
https://github.com/PythonerLeague/PythonerLeague_translate

猜你喜欢

转载自blog.csdn.net/qq_21372359/article/details/130017393