Write 500 words with 30% dialogue

Dialogue tags

Various tasks related to dialogue tags in text.

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Z.AI GLM 5 Turbo	97%
Gemini 3.1 Pro (Preview)	96%
GPT-5 Mini	87%
Z.AI GLM 5.1	86%
GPT-5	84%
Claude Sonnet 4.6 (Reasoning)	82%
o4 Mini High	80%
MiniMax M2.5	74%
o4 Mini	73%
MiniMax M2.7	71%
Nemotron 3 Super	71%
Grok 4.3 (Reasoning)	71%
Claude Opus 4.6 (Reasoning)	68%
MoonshotAI: Kimi K2.6	61%
Inception Mercury 2	58%
Nemotron 3 Nano	55%
Claude Opus 4.5	52%
Claude Sonnet 4.6	51%
Stealth: Aurora Alpha	51%
Qwen 3.6 Flash	46%

	Score	Cost	Time
GPT-5 Mini	87%	$0.013	1.1m
Z.AI GLM 5 Turbo	97%	$0.053	2.2m
GPT-5	84%	$0.074	2.0m
MiniMax M2.5	74%	$0.024	3.9m
o4 Mini High	80%	$0.066	2.5m
Gemini 3.1 Pro (Preview)	96%	$0.176	2.3m
Inception Mercury 2	58%	$0.0064	10.9s
Nemotron 3 Super	71%	$0.0000	4.5m
Grok 4.3 (Reasoning)	71%	$0.047	3.7m
Gemini 3 Flash (Preview)	34%	$0.0021	6.8s
Claude Sonnet 4.6	51%	$0.011	17.5s
o4 Mini	73%	$0.043	1.7m
Claude Opus 4.5	52%	$0.018	19.6s
Claude Opus 4.6	43%	$0.019	21.0s
Claude 3.7 Sonnet	38%	$0.012	15.7s
Grok 4.20 (Beta)	33%	$0.0040	4.0s
Z.AI GLM 5.1	86%	$0.067	5.9m
GPT-4o, Aug. 6th (temp=0)	31%	$0.0070	8.1s
Claude Opus 4.7	38%	$0.027	15.6s
Claude Opus 4.7 (Reasoning)	37%	$0.027	14.7s

	Score	Consistency	Stability
Z.AI GLM 5 Turbo	97%	83%	83%
Gemini 3.1 Pro (Preview)	96%	76%	76%
GPT-5 Mini	87%	59%	57%
Z.AI GLM 5.1	86%	57%	56%
Claude Sonnet 4.6 (Reasoning)	82%	58%	55%
o4 Mini High	80%	47%	45%
MiniMax M2.7	71%	63%	43%
Claude Sonnet 4.6	51%	81%	41%
o4 Mini	73%	55%	39%
GPT-5	84%	36%	36%
Claude Opus 4.5	52%	69%	35%
Grok 4.3 (Reasoning)	71%	48%	34%
MiniMax M2.5	74%	34%	33%
Nemotron 3 Super	71%	36%	32%
Claude Opus 4.7	38%	76%	32%
Claude 3.7 Sonnet	38%	65%	30%
Claude Opus 4.6 (Reasoning)	68%	33%	28%
Gemini 3 Flash (Preview)	34%	56%	27%
Grok 4.20 (Beta)	33%	62%	27%
Inception Mercury 2	58%	45%	26%

	Score	Cost	Speed	Stability
Z.AI GLM 5 Turbo	97%	$0.053	2.2m	83%
GPT-5 Mini	87%	$0.013	1.1m	57%
Gemini 3.1 Pro (Preview)	96%	$0.176	2.3m	76%
Claude Sonnet 4.6	51%	$0.011	17.5s	41%
o4 Mini	73%	$0.043	1.7m	39%
Inception Mercury 2	58%	$0.0064	10.9s	26%
Claude Opus 4.5	52%	$0.018	19.6s	35%
o4 Mini High	80%	$0.066	2.5m	45%
GPT-5	84%	$0.074	2.0m	36%
Claude 3.7 Sonnet	38%	$0.012	15.7s	30%
Gemini 3 Flash (Preview)	34%	$0.0021	6.8s	27%
Claude Opus 4.7	38%	$0.027	15.6s	32%
Z.AI GLM 5.1	86%	$0.067	5.9m	56%
Grok 4.20 (Beta)	33%	$0.0040	4.0s	27%
MiniMax M2.5	74%	$0.024	3.9m	33%
Nemotron 3 Super	71%	$0.0000	4.5m	32%
GPT-4o, Aug. 6th (temp=0)	31%	$0.0070	8.1s	26%
Claude Opus 4.6	43%	$0.019	21.0s	20%
GPT-4o Mini (temp=0)	30%	$0.0005	10.8s	22%
Grok 4.3 (Reasoning)	71%	$0.047	3.7m	34%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	# 6	# 7	# 8	# 9	# 10	Total
1	Z.AI GLM 5 Turbo	$0.053	2.2m	83%	100	100	100	100	100	100	100	100	94	71	97%
3	Gemini 3.1 Pro (Preview)	$0.176	2.3m	76%	100	100	100	100	100	100	100	100	100	60	96%
2	GPT-5 Mini	$0.013	1.1m	57%	100	100	100	100	97	96	96	89	50	42	87%
13	Z.AI GLM 5.1	$0.067	5.9m	56%	100	100	100	100	99	98	95	84	46	43	86%
9	GPT-5	$0.074	2.0m	36%	100	100	100	100	100	100	100	95	39	5	84%
63	Claude Sonnet 4.6 (Reasoning)	$0.297	3.3m	55%	100	98	98	97	95	92	86	59	53	42	82%
8	o4 Mini High	$0.066	2.5m	45%	100	100	100	100	99	90	90	50	50	25	80%
15	MiniMax M2.5	$0.024	3.9m	33%	100	99	99	98	97	96	52	50	46	0	74%
5	o4 Mini	$0.043	1.7m	39%	100	100	100	91	77	65	61	58	43	39	73%
68	MiniMax M2.7	$0.041	8.5m	43%	100	94	91	82	68	66	61	50	50	50	71%
16	Nemotron 3 Super	$0.0000	4.5m	32%	100	100	95	94	93	87	50	48	44	0	71%
20	Grok 4.3 (Reasoning)	$0.047	3.7m	34%	100	99	96	93	83	60	57	50	50	19	71%
139	Claude Opus 4.6 (Reasoning)	$0.275	2.0m	28%	100	100	99	96	87	83	38	36	24	13	68%
146	MoonshotAI: Kimi K2.6	$0.071	7.6m	23%	100	100	100	57	50	46	42	41	40	32	61%
6	Inception Mercury 2	$0.0064	10.9s	26%	100	98	72	69	62	54	49	38	36	5	58%
145	Nemotron 3 Nano	$0.0069	8.0m	16%	100	100	86	82	63	50	33	33	0	0	55%
7	Claude Opus 4.5	$0.018	19.6s	35%	94	54	52	51	50	49	49	49	43	30	52%
4	Claude Sonnet 4.6	$0.011	17.5s	41%	74	55	55	53	53	50	48	47	45	34	51%
35	Stealth: Aurora Alpha	—	15.6s	17%	94	92	80	77	53	50	39	25	0	0	51%
26	Qwen 3.6 Flash	$0.018	56.9s	11%	99	99	87	50	50	28	25	19	7	0	46%
29	Qwen 3.5 27B	$0.028	2.4m	23%	96	75	58	51	50	49	46	24	12	0	46%
56	Gemma 4 31B (Reasoning)	$0.0023	3.7m	13%	99	89	76	48	43	34	30	8	3	0	43%
18	Claude Opus 4.6	$0.019	21.0s	20%	93	72	61	51	50	50	48	4	1	1	43%
40	Gemma 4 26B (Reasoning)	$0.0035	4.0m	23%	95	59	50	50	48	46	43	27	8	0	43%
10	Claude 3.7 Sonnet	$0.012	15.7s	30%	50	50	50	48	48	45	43	41	7	0	38%
12	Claude Opus 4.7	$0.027	15.6s	32%	51	50	50	47	45	38	34	25	22	18	38%
140	MoonshotAI: Kimi K2.5	$0.031	4.2m	6%	98	97	84	39	27	27	0	0	0	0	37%
21	Claude Opus 4.7 (Reasoning)	$0.027	14.7s	23%	75	50	50	48	41	41	41	14	10	0	37%
144	Qwen3.6 Max Preview	$0.084	5.0m	25%	67	50	50	50	49	47	41	2	0	0	36%
147	Qwen 3.5 397B A17B	$0.040	5.2m	6%	98	96	50	47	26	17	15	3	0	0	35%
31	Gemini 3 Flash (Preview, Reasoning)	$0.019	36.3s	6%	100	82	71	47	40	7	0	0	0	0	35%
41	ByteDance Seed 2.0 Mini	$0.0031	3.5m	24%	57	55	51	38	36	35	29	26	12	6	35%
11	Gemini 3 Flash (Preview)	$0.0021	6.8s	27%	50	50	49	49	49	49	41	2	0	0	34%
25	Gemini 2.5 Flash (Reasoning)	$0.019	37.0s	22%	60	50	50	47	41	29	28	22	7	0	33%
14	Grok 4.20 (Beta)	$0.0040	4.0s	27%	50	50	49	49	45	41	22	22	1	0	33%
24	Grok 4	$0.015	35.4s	22%	50	49	49	45	38	30	30	18	7	0	32%
17	GPT-4o, Aug. 6th (temp=0)	$0.0070	8.1s	26%	50	43	43	43	43	41	38	5	0	0	31%
19	GPT-4o Mini (temp=0)	$0.0005	10.8s	22%	50	50	45	38	34	30	26	18	14	0	30%
27	ByteDance Seed 2.0 Lite	$0.0053	1.0m	22%	53	50	47	46	41	31	25	10	0	0	30%
61	Grok 4.20 (Reasoning)	$0.028	2.1m	14%	93	48	38	33	30	26	13	7	5	0	29%
22	Gemini 3.1 Flash Lite (Preview)	$0.0009	3.7s	20%	49	49	48	43	38	26	18	14	1	0	29%
95	GPT-OSS 120B	$0.0013	2.8m	6%	97	83	38	26	18	16	0	0	0	0	28%
23	Gemini 3.1 Flash Lite (Reasoning)	$0.0009	9.9s	19%	50	50	48	47	45	22	7	5	3	0	28%
30	Qwen 3.5 Flash	$0.0041	1.2m	20%	49	47	46	42	34	30	18	0	0	0	27%
38	Claude Opus 4	$0.060	31.2s	20%	47	47	45	41	38	26	10	7	0	0	26%
36	Claude Sonnet 4	$0.011	15.3s	6%	82	50	49	42	17	9	8	0	0	0	26%
80	GPT-5.1	$0.039	1.1m	4%	100	52	48	35	21	2	0	0	0	0	26%
102	Z.AI GLM 4.7	$0.0076	3.4m	14%	60	50	45	29	25	22	19	1	0	0	25%
28	Mistral Large	$0.022	19.4s	20%	49	49	45	36	35	32	0	0	0	0	25%
50	Qwen 3.6 35B	$0.016	1.4m	11%	53	50	49	47	33	8	3	2	0	0	25%
47	GPT-5 Nano	$0.0037	1.5m	9%	74	50	50	27	20	18	2	0	0	0	24%
66	Qwen 3.5 122B	$0.033	1.5m	13%	50	50	49	41	40	8	3	0	0	0	24%
39	Mistral Medium 3.1	$0.0017	23.5s	4%	74	50	50	49	18	0	0	0	0	0	24%
143	DeepSeek V4 Pro (Reasoning)	$0.0094	3.3m	1%	92	60	50	21	3	0	0	0	0	0	23%
42	GPT-5.5	$0.033	29.2s	13%	48	46	44	35	24	16	6	2	2	0	22%
69	Grok 4.20 (Beta, Reasoning)	$0.057	37.9s	12%	49	49	43	31	25	15	6	0	0	0	22%
33	Grok 4.20	$0.0018	13.9s	8%	50	50	43	41	14	14	3	1	1	0	22%
44	Inception Mercury	$0.0013	14.1s	2%	100	58	36	11	10	0	0	0	0	0	22%
55	Z.AI GLM 5	$0.013	1.7m	15%	50	45	41	26	26	23	2	0	0	0	21%
32	Hermes 3 405B	$0.0000	38.3s	12%	50	45	41	34	30	10	1	0	0	0	21%
34	Gemma 3 12B	$0.0001	17.2s	9%	50	49	43	38	30	0	0	0	0	0	21%
79	Gemini 2.5 Pro	$0.030	27.1s	0%	86	68	50	2	0	0	0	0	0	0	21%
37	Grok 4 Fast	$0.0005	7.2s	5%	50	49	45	43	18	1	0	0	0	0	21%
105	Qwen 3.5 Plus (2026-04-20)	$0.020	2.2m	9%	54	49	38	26	17	14	1	0	0	0	20%
141	Qwen 3.6 27B	$0.031	2.3m	2%	97	49	22	22	10	0	0	0	0	0	20%
48	DeepSeek V4 Flash	$0.0002	12.7s	0%	50	50	49	43	1	0	0	0	0	0	19%
46	Gemini 2.5 Flash Lite	$0.0003	3.6s	1%	50	50	47	26	3	0	0	0	0	0	18%
45	Ministral 3 14B	$0.0002	7.6s	4%	50	43	41	26	11	1	0	0	0	0	17%
51	LFM2 24B	$0.0001	18.0s	2%	50	50	45	18	5	2	1	0	0	0	17%
62	DeepSeek V3 (2024-12-26)	$0.0008	24.8s	0%	50	49	47	22	0	0	0	0	0	0	17%
59	Gemini 2.5 Flash Lite (Reasoning)	$0.0031	37.7s	4%	50	48	39	17	7	5	0	0	0	0	17%
52	Arcee AI: Trinity Mini	$0.0002	6.1s	0%	50	48	34	34	0	0	0	0	0	0	17%
54	Claude 3 Haiku	$0.0009	6.5s	0%	79	66	15	3	1	0	0	0	0	0	17%
43	Mistral Large 3	$0.0012	16.2s	7%	43	38	34	22	22	0	0	0	0	0	16%
57	Mistral Small 4	$0.0004	7.2s	1%	70	45	34	3	3	0	0	0	0	0	16%
67	Xiaomi MIMO v2.5 Pro	$0.0039	26.4s	1%	49	46	30	25	2	2	1	0	0	0	16%
53	Gemini 3.1 Flash Lite	$0.0009	8.3s	1%	49	45	34	22	3	2	0	0	0	0	16%
115	GPT-5.4 (Reasoning)	$0.028	42.0s	0%	75	50	18	6	1	0	0	0	0	0	15%
58	Claude Haiku 4.5	$0.0036	8.4s	1%	50	47	26	22	3	1	0	0	0	0	15%
104	ByteDance Seed 1.6	$0.0068	1.3m	2%	53	45	24	10	4	2	2	2	1	0	14%
49	GPT-4o, May 13th (temp=0)	$0.013	23.0s	9%	45	23	22	16	15	10	8	3	1	0	14%
60	Ministral 8B	$0.0001	5.5s	0%	49	49	41	0	0	0	0	0	0	0	14%
130	Gemini 3 Pro (Preview)	$0.039	31.4s	0%	50	45	27	18	0	0	0	0	0	0	14%
71	DeepSeek V4 Flash (Reasoning)	$0.0002	18.5s	0%	48	41	38	0	0	0	0	0	0	0	13%
64	Ministral 3 8B	$0.0001	4.4s	0%	50	50	26	0	0	0	0	0	0	0	13%
101	Z.AI GLM 4.7 Flash	$0.0013	1.0m	0%	50	43	26	1	0	0	0	0	0	0	12%
70	Claude Sonnet 4.5	$0.011	15.4s	4%	42	37	19	11	6	5	1	0	0	0	12%
77	Cohere Command R+ (Aug. 2024)	$0.0073	17.8s	0%	48	47	22	0	0	0	0	0	0	0	12%
78	Hermes 3 70B	$0.0004	30.2s	0%	43	41	31	1	0	0	0	0	0	0	12%
65	Ministral 3 3B	$0.0001	2.5s	1%	52	46	13	3	2	0	0	0	0	0	12%
116	GPT-5.5 (Reasoning)	$0.034	27.6s	3%	49	23	17	13	6	2	1	0	0	0	11%
126	GPT-5.2	$0.022	37.6s	0%	49	44	17	0	0	0	0	0	0	0	11%
73	GPT-4o, Aug. 6th (temp=1)	$0.0077	8.8s	1%	49	29	22	5	2	0	0	0	0	0	11%
134	GPT-5.5 (Reasoning, Low)	$0.035	31.3s	0%	39	38	26	2	0	0	0	0	0	0	11%
86	GPT-4o, May 13th (temp=1)	$0.013	19.4s	1%	47	31	13	6	4	0	0	0	0	0	10%
137	Qwen 3.5 35B	$0.021	1.1m	0%	94	3	1	0	0	0	0	0	0	0	10%
74	Gemini 2.5 Flash	$0.0021	5.4s	0%	45	34	10	0	0	0	0	0	0	0	9%
87	GPT-5.4 (Reasoning, Low)	$0.016	26.8s	4%	25	20	15	15	10	0	0	0	0	0	8%
75	Mistral NeMO	$0.0001	8.5s	0%	44	26	6	2	0	0	0	0	0	0	8%
83	Xiaomi MIMO v2.5	$0.0019	12.6s	0%	47	18	14	0	0	0	0	0	0	0	8%
113	GPT-5.4	$0.014	27.0s	0%	47	25	2	2	1	0	0	0	0	0	8%
72	GPT-5.4 Nano (Reasoning, Low)	$0.0017	7.2s	2%	37	17	12	4	3	3	1	0	0	0	8%
81	GPT-4o Mini (temp=1)	$0.0005	10.5s	0%	41	30	5	0	0	0	0	0	0	0	8%
84	Grok 4.1 Fast	$0.0005	13.1s	0%	48	22	2	0	0	0	0	0	0	0	7%
76	Ministral 3B	$0.0000	3.4s	0%	65	3	0	0	0	0	0	0	0	0	7%
85	GPT-4.1 Mini	$0.0014	9.7s	0%	50	11	7	0	0	0	0	0	0	0	7%
111	DeepSeek-V2 Chat	$0.0002	41.2s	0%	49	10	2	1	0	0	0	0	0	0	6%
93	GPT-4.1	$0.0064	10.6s	0%	48	14	0	0	0	0	0	0	0	0	6%
103	Gemma 4 26B	$0.0002	31.2s	0%	30	30	0	0	0	0	0	0	0	0	6%
88	Grok 4.3	$0.0016	10.9s	0%	50	3	3	0	0	0	0	0	0	0	6%
89	DeepSeek V3 (2025-03-24)	$0.0007	14.5s	0%	43	13	0	0	0	0	0	0	0	0	6%
82	Llama 3.1 8B	$0.0001	2.4s	0%	53	2	0	0	0	0	0	0	0	0	5%
138	Z.AI GLM 4.6	$0.0045	1.3m	0%	50	3	0	0	0	0	0	0	0	0	5%
107	WizardLM 2 8x22b	$0.0008	31.8s	0%	49	2	2	0	0	0	0	0	0	0	5%
108	Qwen 3 32B	$0.0006	31.7s	0%	50	2	0	0	0	0	0	0	0	0	5%
98	Gemma 3 27B	$0.0002	22.6s	0%	49	3	0	0	0	0	0	0	0	0	5%
99	Qwen 2.5 72B	$0.0004	23.1s	0%	47	3	1	0	0	0	0	0	0	0	5%
129	DeepSeek V3.2	$0.0006	48.1s	0%	50	0	0	0	0	0	0	0	0	0	5%
92	Mistral Small 3.2 24B	$0.0002	14.4s	0%	26	22	1	0	0	0	0	0	0	0	5%
94	GPT-5.4 Mini	$0.0046	6.1s	0%	28	12	4	2	0	0	0	0	0	0	5%
112	Rocinante 12B	$0.0004	32.6s	0%	43	3	0	0	0	0	0	0	0	0	5%
100	Qwen3 235B A22B Instruct 2507	$0.0003	21.2s	0%	43	0	0	0	0	0	0	0	0	0	4%
97	Arcee AI: Trinity Large (Preview)	$0.0000	15.9s	0%	43	0	0	0	0	0	0	0	0	0	4%
121	Qwen 3.5 Plus (2026-02-15)	$0.0020	33.3s	0%	26	17	0	0	0	0	0	0	0	0	4%
119	Aion 2.0	$0.0019	31.7s	0%	38	2	1	1	0	0	0	0	0	0	4%
90	Gemma 3 4B	$0.0001	8.3s	0%	38	2	0	0	0	0	0	0	0	0	4%
91	Llama 3.1 70B	$0.0006	7.2s	0%	30	5	1	0	0	0	0	0	0	0	4%
136	Claude 3.5 Sonnet	$0.014	46.8s	0%	34	1	1	1	0	0	0	0	0	0	4%
142	Qwen 3.5 9B	$0.0011	1.6m	0%	21	10	2	0	0	0	0	0	0	0	3%
124	Mistral Small 4 (Reasoning)	$0.0024	28.0s	0%	18	12	3	0	0	0	0	0	0	0	3%
96	GPT-5.4 Nano	$0.0018	7.3s	0%	25	3	2	1	0	0	0	0	0	0	3%
117	Stealth: Hunter Alpha	$0.0000	22.2s	0%	22	0	0	0	0	0	0	0	0	0	2%
118	Llama 3.1 Nemotron 70B	$0.0003	23.4s	0%	22	0	0	0	0	0	0	0	0	0	2%
106	GPT-5.4 Mini (Reasoning, Low)	$0.0044	5.9s	0%	18	1	0	0	0	0	0	0	0	0	2%
128	Mistral Large 2	$0.0044	18.8s	0%	10	0	0	0	0	0	0	0	0	0	1%
125	Stealth: Healer Alpha	$0.0000	22.0s	0%	8	1	0	0	0	0	0	0	0	0	1%
110	GPT-5.4 Nano (Reasoning)	$0.0018	8.5s	0%	7	0	0	0	0	0	0	0	0	0	1%
135	DeepSeek V3.1	$0.0007	45.3s	0%	7	0	0	0	0	0	0	0	0	0	1%
123	ByteDance Seed 1.6 Flash	$0.0006	14.5s	0%	2	0	0	0	0	0	0	0	0	0	0%
109	Mistral Small Creative	$0.0003	5.4s	0%	1	0	0	0	0	0	0	0	0	0	0%
131	Gemma 4 31B	$0.0002	26.5s	0%	0	0	0	0	0	0	0	0	0	0	0%
122	Z.AI GLM 4.5	$0.0013	12.1s	0%	0	0	0	0	0	0	0	0	0	0	0%
133	Writer: Palmyra X5	$0.0053	22.0s	0%	0	0	0	0	0	0	0	0	0	0	0%
120	GPT-5.4 Mini (Reasoning)	$0.0046	5.8s	0%	0	0	0	0	0	0	0	0	0	0	0%
127	Z.AI GLM 4.5 Air	$0.0009	19.4s	0%	0	0	0	0	0	0	0	0	0	0	0%
114	GPT-4.1 Nano	$0.0004	8.6s	0%	0	0	0	0	0	0	0	0	0	0	0%
132	DeepSeek V4 Pro	$0.0008	28.3s	0%	0	0	0	0	0	0	0	0	0	0	0%
22.85%

Median	Evaluator	Top 3	Flop 3
9.2%	Dialogue to Total Word Ratio	100Gemini 3.1 Pro (Preview) 94Z.AI GLM 5.1 93Z.AI GLM 5 Turbo	0Gemma 3 27B 0Grok 4.20 (Beta) 0DeepSeek V4 Flash (Reasoning)
15.6%	Matches word count	100Z.AI GLM 5 Turbo 100MiniMax M2.7 92Gemini 3.1 Pro (Preview)	0GPT-5.4 Nano (Reasoning) 0GPT-5.4 0GPT-5.4 Nano

Dialogue tags

Write 500 words with 30% dialogue

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)