新智元报道
【新智元导读】 时隔5个月,Imagen 3终于可以人人可用了,而且还能支持是生成人物图像。与此同时,谷歌宣布了Gemini AI的重大升级,全新AI定制助手Gems已经面向150多个国家推出。
Gemini AI平台又双叒升级了。
这次,谷歌直接给配上了Gems助手,还有最新图像生成模型Imagen 3!这当中,最让人兴奋的便是,Imagen 3可以人人用上了。网友们早已急不可耐,纷纷上手开启了测试。
Imagen 3支持人物生成了
5月的I/O开发者大会上,谷歌首次对外亮相了Imagen 3图像生成的能力。此后几个月时间,这个AI生图工具一直在测试中。正如当时博文所述,Imagen 3可以根据文本提示,创建出更高质量的图像。另外,Imagen 3设定了图像质量的新标准,只需几个单词就能生成图像。你甚至可以要求Gemini 创作各种风格的图像,比如照片上的写实风景画、纹理油画,或者是异想天开的泥土场景。值得注意的是,谷歌再次引入了生成人类图像的照片。此前,因AI生图人物带上了有色眼镜,谷歌便被全网攻击。为了解决人们对深度造假、错误信息的担忧,谷歌已采取了安全措施,比如水印SynthID。升级后的模型,外媒Ars测试后发现,当让AI生成拜登打篮球的图像时,会被拒绝请求。而当你请求「美国总统打篮球」,便可以得到更多的请求选择。另外,在一些快速测试中,Imagen 3还避免了生成「历史上不准确」的种族陷阱。比如,让它生成一副英国国王肖像,AI会生成穿着一袭红色长袍,留着胡须的白人,而不是以往种族多元化战士的组合。如下是生成教皇的照片,可以看出整体非常稳定。以往的生图效果是下面这样的,左右性别不一致,而且样貌多样。现在,当你再让Imagen 3去描绘历史场景,便会违反谷歌的人工智能的规则。然而,谷歌Gemini此前毫不避讳地生成出了,穿着纳粹风格衣服的亚洲人、黑人。有人测试后,感觉Imagen 3整体效果不错,不过仍有很长的路要走。
定制AI助手Gems
专门化的人工智能助手Gems支持Gemini Advanced,企业、以及商业用户,面向150多个国家。现在,任何一个人可以通过Gems,为特定任务训练一个「数字专家」。它可以是编码导师,也可以是营销策略师等等。谷歌希望,这类面向定特任务的AI助手,能够解决像GPT-4o这样通用语言模型的局限性。因为通过专门数据训练/定制的专业助手,能够提供更加实用、更高效的解决方案。
AI巨头激战正酣,谷歌毫不示弱
过去一年里,包括OpenAI、微软、Meta、Anthropic、HuggingFace等在内的公司,都推出了可定制的AI聊天机器人平台。这标志着整个行业,向个性化AI体验转变。OpenAI的GPT Store于1月推出之后,开发者们可以创建和分享ChatGPT的定制版本。微软的Copilot Studio,可以让企业能够开发定制的AI助手,而Meta的AI Studio是为了创建定制聊天机器人。Anthropic展示了Claude自动化任务的能力,HuggingFace为定制GPT提供了一个开源的解决方案。此时,Gems和Imagen 3的发布,似乎是谷歌试图追赶,甚至赶超竞争对手的一次尝试。一直以来,谷歌是AI研究领域的先驱,但在面向消费者的AI产品推向市场方面,有时会落后于对手。特别是,在别家早已发布自定义助手之后,谷歌才有所行动。
从科幻到现实:AI重塑世界
话又说回来,不论是谁家发布,这一新功能可能会对整个行业,产生深远的影响。在教育领域,AI导师可能会提供个性化学习体验;在医疗保健中,专门的AI助手能诊断和治疗规划。在企业中,可以使用定制AI工具简化运营。另一方面,AI的进步也引发了关于数据隐私、工作替代、潜在滥用的问题。尽管谷歌采取了一些强有力的安保措施,但AI发展的步伐已经超过了监管框架。随着AI继续深入日常生活,谷歌Gemini AI可能会激发出这项技术的变革潜力。
版权声明
本文为本站原创内容,转载需注明文章来源(https://www.eiefun.com),另:文中部分素材可能会引用自其他平台,如有侵权或其它,请联系 admin@eiefun.com,我们会第一时间配合删除