作者: rcp发布文章

5秒内克隆声音并生成任意语音内容。比较早开源的声音克隆开源项目,支持中文克隆,提供GUI界面,效果还是有些金属音的感觉。开源地址:https://github.com/babysor/MockingBird00:00 / 00:002X快进中重播播放00:00 / 00:00 正在直播00:0000

阅读更多

一个基于大模型构建聊天应用的平台,简单说就可以用这个工具搭建一个ChatGPT,或者其他的基于大模型的应用。已经有超过10万个应用基于 Dify.AI 构建。它融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈

阅读更多

AI生成图片的效果已经很好了,成熟度非常高了,现在大家又开始卷视频生成了。著名的开源图片生成模型Stable Diffusion所属公司StabilityAI,最近发布了基于扩散模型的视频生成模型,可以根据一张图片生成一段动态的视频。

阅读更多

这两个让图片动起来的项目当前热度都非常高,分别是AnimateAnyone和MagicAnimate,一个来自阿里,一个来自字节。都是输入一张静态的图片,输入一个姿势驱动的视频,就能让图片安装视频的姿势动作动起来。

阅读更多

基于使用 tldraw 和 gpt-4-vision api,根据绘制的线框生成 html 的应用程序。其工作原理是获取当前画布 SVG,将其转换为 PNG,然后将该 png 发送到 gpt-4-vision,并附有指令以返回带有 tailwind 的单个 html 文件。

阅读更多