近期,多种强大的人工智能工具密集发布,今天,小编就为大家分享一下近期的Ai大事件。
1.Stack Overflow Ai发布
Stack Overflow是全球最大的技术问答网站,程序员和开发者可以在这里提出问题并获得答案,不过随着ChatGPT等人工智能工具的出现,Stack Overflow的流量呈现断崖式下滑,用户数量也在急剧减少,随着ChatGPT代码解释器的推出,Stack Overflow将会面临更加严峻的挑战,为了跟上时代Stackoverflow在近期推出了生成式ai工具,用于提高搜索效率,快速帮助开发者解决问题。
如果你正在从事编程工作,或者想在第1时间体验该工具,就可以加入Overflow的等待列表。
体验地址为:
https://stackoverflow.co/labs/
2.Youtube加入视频总结功能
7月31日,YouTube发布了一则测试信息,根据油管的描述,油管正在测试一项新的功能,也就是使用人工智能技术,对视频进行智能总结并推送给观众,此项功能旨在让观众快速浏览长视频的核心内容,并决定是否观看。
YouTube此举的意图很明显,也就是在提高用户观看体验的同时杜绝一些冗长无价值的视频!
YouTube总结功能:
https://support.google.com/youtube/thread/18138167
3.Audiogen模型
近期,Meta发布了文本转音频的audiocraft模型Audiocraft,由三个独立模型组成,其中包括一个解码器,和两个音频生成模型,以之前发布的Musicgen为例,我们只需输入一段提示词,就可以获得由乐器演奏的音频,而Audiogen,则可以生成各种类型的音效。
AudioGen云端运行:
https://github.com/camenduru/audiogen-colab
4.阿里云开源通义千问模型
8月3日,阿里云开源了70亿参数的大语言模型通义千问,目前Qwen-7B-Chat模型已经可以在阿里达摩院的modelscope社区下载,并允许商业化使用,通义千问拥有和meta llama 2相同的参数,并且增加了对中文的支持,该模型的大小为14GB,点击上方的模型文件即可下载。Qwen模型到本地,通义千问为用户提供了在线demo和免费的算力!
用通义千问和llama 2模型输入相同的问题,从对比可以看出通义千问对中文的理解能力更强,通义千问模型的推出,不但弥补了中国在开源LLM方面的不足,还增强了对中文的支持,不过, 该模型的缺点是运行不稳定,上下文能力有限。
5.Google搜索引擎加入生成式AI
近期,Google官方博客发布了一篇文章,介绍了基于Ai技术的搜索体验,也叫做SGE,在接下来的一周内,用户在搜索特定词条的时候,就会看到以下画面!
加入Ai功能后,用户不但可以获得更为准确的结果, 还能点击延伸体验获取更多的信息,可以确定的是 以Google、BING为主的搜索引擎,将会在2023年全面迈向人工智能化。
6.Nvidia 100K-B模型
近日,英伟达发布了一个不可思议的文本转图像模型Perfusion,只需10分钟的时间,就能完成模型的训练,perfusion的容量仅有100 KB,也是迄今为止最小的文生图模型,Perfusion的操作非常简单,用户只需上传样本图像,输入一段提示词,就可以获得和原图风格高度类似的图像,在和Dreambooth等传统模型的对比中,由Perfusion生成的图像更加真实。
此外,用户还可以同时上传多张素材图,并应用到新生成的图像中,目前,Perfusion还处于测试阶段,不过,Perfusion的推出,将会进一步简化文本转图像模型的训练流程。
Nvidia 100K模型:
https://arxiv.org/pdf/2305.01644.pdf
7.Leonardo升级
本周,Leonardo的主页完成了改版,正式结束了内部测试,Leonardo提供了免费的在线绘图服务,一直具备很高的人气,在本次的更新中,Leonardo加入了PhotoReal功能,可以生成照片级真实的人像作品,如果你是BETA用户就可以使用PhotoReal功能。
在该模式下生成的人像非常真实,效果堪比专业的摄影作品,用户只需输入简单的提示词,设置好预设风格就能获得高质量的图像。
目前,Leonardo已经面向所有人开放,感兴趣的同学可以注册使用。
8.MetaGPT
近期,MetaGPT正式在github上开源,截止到今天,该项目已经获得了11K星标,可见其火热程度,有了该工具任何人都可以组建一个软件开发公司,在MetaGPT中输出一段具体的要求系统就能规划设计并生成产品文档,测试代码和主程序全程自动化完成软件设计。
从官方提供的演示流程可以看出使用者只需花费0.2美元的GPT4 API费用,就能设计一个类似今日头条的推荐系统,MetaGPT可以为GPT分配不同的角色,并使其协同完成软件开发,有了该工具,开发者就能用更简单的方法,把自己的创意转换为实际的软件项目。
MetaGPT同时提供了中文说明文档,以及本地安装的方法:
https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
9.DWPose发布
本周,由清华大学开发的DWPose项目,采用了两级蒸馏法,可以进行有效的全身姿态估测,相比openpose插件,DWPose能够更准确的控制人物的动作和姿态,目前,该项目已经开源!
DWPose下载地址:
https://github.com/IDEA-Research/DWPosehttps://github.com/camenduru/DWPose-colab
暂无评论内容