AI应用落地——快速用户打标签
随着Gamma3 的发布,在4B模型上也能有很好的图形理解能力,正好最近游戏上需要使用AI主播能力,虚拟生成用户提供到对局游戏中,因为某种原因,要求AI玩家具备强烈的风格特征包含,该类特诊需要包含在头像和昵称中,
用户信息在平台上有很多,但基本都是登录并不伴随行为,特征等信号,很难实现策划要求的,不同风格特征的用户信息模拟,在抽样了部分用户头像的数据之后,发现头像内容本身就是一个具备强标签特诊的文本内容,可以从头像与昵称中分析得出用户的性别,等标签分类,用以支持虚拟玩家的生成。说做就做,先使用某个头像来试试看,并调优确认prompt 提示词。(用户数据来源为自有平台的同类型应用)
本次所使用的提示词
深度解析用户头像,按超细化维度返回JSON结果:
1. **头像类型**(单选):[真人照片/二次元角色/动物图片/虚构内容/抽象图形/文字符号/其他类别]
2. **性别倾向**(单选):[生物性别/符号化性别/不可判定]
3. **内容风格**(多选,最多3项):[艺术流派/设计语言/文化元素/情绪表达/技术特征]
输出要求:
- 严格使用JSON格式
- 层级选择需完整(例:"avatar_type": "二次元角色/赛璐璐")
- 风格标签按显著性降序排列
- 对AI生成内容必须标记生成技术痕迹
示例:
{ "avatar_type": "抽象图形/AI生成", "gender": "符号化性别/♂符号倾向", "style": ["故障艺术", "赛博朋克", "低多边形"] }
使用的是 gamma3:4b 蒸馏模型,1B模型不具备图片的处理能力,运行在1660 Super上单次请求处理时间为30~40s.
返回数据样例如下
{
"avatar_type": "真人照片", "gender": "不可判定", "style": ["写实", "自然", "光影效果"], "tech_trace": "AI生成"}
样例图片
但是没看出来哪里是真人在哪里,可能因为使用4b参数,智能不够吧(树下面有僧人,笑死),不过能 写实,自然,光源效果这也标签还是蛮贴切的。
结构截图
点赞过300,开源该项目代码