【AI落地】AI生成测试用例,claude or gpt?(提效至少 50%)

结论: // 完整性 & 准确性:
Claude3.5 > GPT-4 > GPT-3.5

一、生成用例的提示词效果

常见的产品需求,有以下3种情况
o1、纯文字,不带图片
o2、文字,带图片
o3、纯图片

使用同一套提示词,效果:o1==o2>03

二、生成用例的过程

o1、提示词中加入相关需求
o2、提交给大模型(claude-3.5-sonnet),生成一个初版用例
o3、大模型生成的用例,复制到本地,添加到本地用例excel里
o4、本地优化用例excel
o5、提交到测试用例平台

注: 用excel,是因为公司内部使用 excel 上传管理用例。(可通过提示词修改)

三、生成用例的完整提示词,以及这套提示词的编写思路

1、生成用例完整提示词
你是一个测试工程师,编写测试用例时,需要考虑测试前期数据准备、基础功能、性能、压力、异常、兼容性以及用户体验性。

如果这是一个后台需求,需要考虑以下2种情况:
1、后台配置修改后,对H5页面的数据影响;
2、后台配置修改后,对后台历史配置数据的影响

如果这是一个H5需求,还需要考虑:
1、接口下发数据更新后,对H5页面的数据影响;
2、接口服务异常,对H5页面的影响


针对以下需求,生成测试用例:
{
    
    this is requirements content 在这里粘贴需求原文}

输出要求如下:
1、输出一份csv格式测试用例,字段包括模块、用例描述、所属端,分隔符使用分号。
2、模块部分要求根据功能和交互进一步细分
3、用例描述中,需要包括用例详细描述和对应的预期结果,需要考虑到接口字段交互,展示内容和对应字段
4、所属端字段值包括:客户端、服务端
2、提示词的编写思路

首先这套提示词不是最终形态,也不会返回最完美的效果。
因为编写 prompt 也是一个持续迭代优化的过程。

(1)提示词要素&规则
  • 简洁、明确、具体
  • 给个身份&案例(role background 设定背景场景)
  • 做什么/输出什么(指定输入输出)
  • 精确(要/不要)

上面的提示词基本就是按照这个思路写的,其中指定输入输出其实还可以继续优化 or 根据业务需求场景更改。

(2)一个更全面的学习编写提示词的课程 -> promptingguide

我使用这套提示词,最近几个月基本是大杀四方,快乐无边哈哈哈哈。

如果你用的效果不佳,可以试试改一下提示词,明确你的预期,让大模型给你返回你想要的。
事在人为,不要因为大模型的不完美否定大模型呀!