🎥 Midjourney计划推出“文本转视频”模型,扩展AI形象生成器到视频创作领域。
在一些社交媒体截图中,Riot Games艺术家Jon Lam显示了Holz和其他Midjourney开发人员讨论数据库中至少包含4700位独立艺术家作品的消息。据透露,这些艺术家的名字是从Wikipedia和在线交易卡游戏Magic the Gathering中收集而来。此外,软件开发者Brad Templeton的消息警告Holz可能会在使用真实艺术家作品进行训练时面临“版权问题”。
雷军强调,“技术为本”和“工程师文化”是小米的核心基因。这两项技术的获得,源于工程师团队对梦想的坚持和对技术的极致追求。公司将持续加大研发投入,为工程师提供更多施展空间。
LLaVA在视觉聊天和推理问答方面表现出接近GPT-4水平的能力。在视觉聊天方面,LLaVA的表现相对于GPT-4的评分达到了85%,在推理问答方面更是达到了92.53%的超过GPT-4的新SoTA。LLaVA在回答问题时,能够全面而有逻辑地生成回答,并且可以以JSON格式输出。
模型下载地址:https://huggingface.co/damo-vilab/dreamtalk