Write 200 words with 10% dialogue

Dialogue tags

Various tasks related to dialogue tags in text.

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Gemini 3.1 Pro (Preview)	100%
Z.AI GLM 5 Turbo	100%
GPT-5	100%
Claude Opus 4.6 (Reasoning)	100%
GPT-5 Mini	100%
GPT-5.4 (Reasoning)	100%
GPT-5.1	100%
GPT-5.4 Nano (Reasoning)	100%
Qwen 3.5 397B A17B	100%
MoonshotAI: Kimi K2.6	100%
GPT-5.2	100%
Gemini 3 Flash (Preview, Reasoning)	100%
o4 Mini High	100%
Z.AI GLM 5.1	100%
Claude Sonnet 4.6 (Reasoning)	99%
Gemma 4 31B (Reasoning)	99%
MoonshotAI: Kimi K2.5	97%
Grok 4.20 (Reasoning)	97%
GPT-5 Nano	97%
Qwen 3.5 122B	97%

	Score	Cost	Time
Stealth: Aurora Alpha	89%	—	7.4s
Inception Mercury	85%	$0.0002	8.2s
Inception Mercury 2	90%	$0.0025	4.0s
GPT-5.4 Nano (Reasoning)	100%	$0.0041	24.5s
Claude Opus 4.5	96%	$0.0077	9.3s
GPT-5.5	96%	$0.0087	8.9s
Claude Haiku 4.5	76%	$0.0016	4.4s
GPT-OSS 120B	89%	$0.0015	1.5m
Claude Opus 4.6	82%	$0.0079	9.7s
GPT-5 Mini	100%	$0.0088	45.8s
GPT-5.4 Nano (Reasoning, Low)	81%	$0.0025	15.4s
Claude Sonnet 4	83%	$0.0046	7.5s
Qwen 3.6 35B	89%	$0.0075	53.0s
GPT-5.2	100%	$0.026	29.9s
Qwen 3.6 Flash	92%	$0.015	46.1s
o4 Mini	97%	$0.022	55.0s
Gemini 3 Flash (Preview, Reasoning)	100%	$0.025	40.7s
GPT-5.4 (Reasoning, Low)	91%	$0.025	23.9s
Nemotron 3 Super	90%	$0.0000	2.0m
GPT-5.4 (Reasoning)	100%	$0.034	38.8s

	Score	Cost	Speed	Stability
GPT-5.4 Nano (Reasoning)	100%	$0.0041	24.5s	99%
GPT-5 Mini	100%	$0.0088	45.8s	100%
GPT-5.5	96%	$0.0087	8.9s	90%
Claude Opus 4.5	96%	$0.0077	9.3s	88%
GPT-5.2	100%	$0.026	29.9s	99%
Gemini 3 Flash (Preview, Reasoning)	100%	$0.025	40.7s	99%
GPT-5.4 (Reasoning)	100%	$0.034	38.8s	100%
GPT-5.1	100%	$0.032	49.0s	100%
Z.AI GLM 5 Turbo	100%	$0.026	1.1m	100%
Claude Opus 4.7	88%	$0.011	7.5s	82%
Claude Sonnet 4.6	87%	$0.0045	8.0s	71%
o4 Mini High	100%	$0.036	1.5m	98%
GPT-5	100%	$0.046	1.3m	100%
o4 Mini	97%	$0.022	55.0s	80%
Inception Mercury 2	90%	$0.0025	4.0s	60%
Grok 4.20 (Reasoning)	97%	$0.022	1.7m	90%
Claude Sonnet 4	83%	$0.0046	7.5s	64%
Claude Sonnet 4.5	84%	$0.0046	7.8s	62%
Claude Opus 4.7 (Reasoning)	86%	$0.011	7.2s	63%
Qwen 3.6 Flash	92%	$0.015	46.1s	69%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	# 6	# 7	# 8	# 9	# 10	Total
47	Gemini 3.1 Pro (Preview)	$0.106	1.5m	100%	100	100	100	100	100	100	100	100	100	100	100%
9	Z.AI GLM 5 Turbo	$0.026	1.1m	100%	100	100	100	100	100	100	100	100	100	100	100%
13	GPT-5	$0.046	1.3m	100%	100	100	100	100	100	100	100	100	100	100	100%
42	Claude Opus 4.6 (Reasoning)	$0.116	52.9s	100%	100	100	100	100	100	100	100	100	100	100	100%
2	GPT-5 Mini	$0.0088	45.8s	100%	100	100	100	100	100	100	100	100	100	100	100%
7	GPT-5.4 (Reasoning)	$0.034	38.8s	100%	100	100	100	100	100	100	100	100	100	100	100%
8	GPT-5.1	$0.032	49.0s	100%	100	100	100	100	100	100	100	100	100	100	100%
1	GPT-5.4 Nano (Reasoning)	$0.0041	24.5s	99%	100	100	100	100	100	100	100	100	100	99	100%
65	Qwen 3.5 397B A17B	$0.042	5.3m	99%	100	100	100	100	100	100	100	100	100	99	100%
76	MoonshotAI: Kimi K2.6	$0.041	5.9m	99%	100	100	100	100	100	100	100	100	100	98	100%
5	GPT-5.2	$0.026	29.9s	99%	100	100	100	100	100	100	100	100	99	98	100%
6	Gemini 3 Flash (Preview, Reasoning)	$0.025	40.7s	99%	100	100	100	100	100	100	100	100	99	98	100%
12	o4 Mini High	$0.036	1.5m	98%	100	100	100	100	100	100	100	100	100	96	100%
50	Z.AI GLM 5.1	$0.039	3.8m	97%	100	100	100	100	100	100	100	100	100	95	100%
86	Claude Sonnet 4.6 (Reasoning)	$0.176	1.7m	95%	100	100	100	100	100	100	100	100	100	91	99%
60	Gemma 4 31B (Reasoning)	$0.0036	5.8m	94%	100	100	100	100	100	100	100	100	98	91	99%
44	MoonshotAI: Kimi K2.5	$0.027	3.0m	86%	100	100	100	100	100	100	100	99	97	77	97%
16	Grok 4.20 (Reasoning)	$0.022	1.7m	90%	100	100	100	100	100	100	99	95	93	84	97%
22	GPT-5 Nano	$0.0051	2.1m	81%	100	100	100	100	100	100	100	100	100	68	97%
21	Qwen 3.5 122B	$0.035	1.2m	83%	100	100	100	100	100	100	100	99	97	72	97%
39	MiniMax M2.7	$0.013	2.8m	81%	100	100	100	100	100	100	100	100	99	68	97%
14	o4 Mini	$0.022	55.0s	80%	100	100	100	100	100	100	100	100	100	66	97%
3	GPT-5.5	$0.0087	8.9s	90%	100	100	100	100	100	98	96	93	91	86	96%
4	Claude Opus 4.5	$0.0077	9.3s	88%	100	100	100	100	99	99	98	97	89	82	96%
41	Qwen 3.6 27B	$0.029	2.1m	78%	100	100	100	100	100	100	100	100	100	64	96%
35	Qwen 3.5 27B	$0.026	1.8m	76%	100	100	100	100	100	100	100	100	99	60	96%
30	GPT-5.5 (Reasoning)	$0.050	24.8s	70%	100	100	100	100	100	100	100	100	100	51	95%
36	Grok 4.3 (Reasoning)	$0.022	1.8m	75%	100	100	100	100	100	100	100	100	68	68	94%
82	Qwen3.6 Max Preview	$0.067	3.7m	75%	100	100	100	100	100	100	100	100	68	68	94%
49	Nemotron 3 Nano	$0.0026	2.8m	68%	100	100	100	100	100	100	100	100	76	50	93%
28	Grok 4.20 (Beta, Reasoning)	$0.043	28.1s	71%	100	100	100	100	100	100	99	98	64	64	92%
55	Gemma 4 26B (Reasoning)	$0.0040	3.8m	71%	100	100	100	100	100	100	97	91	84	52	92%
20	Qwen 3.6 Flash	$0.015	46.1s	69%	100	100	100	100	99	99	99	98	68	56	92%
27	GPT-5.5 (Reasoning, Low)	$0.041	20.8s	68%	100	100	100	100	100	100	100	100	60	60	92%
40	GPT-5.4 (Reasoning, Low)	$0.025	23.9s	52%	100	100	100	100	100	100	99	99	93	20	91%
45	Nemotron 3 Super	$0.0000	2.0m	61%	100	100	100	100	100	100	100	100	51	51	90%
15	Inception Mercury 2	$0.0025	4.0s	60%	100	100	100	100	100	100	100	99	50	50	90%
23	Stealth: Aurora Alpha	—	7.4s	66%	100	100	100	100	100	100	100	76	68	50	89%
38	GPT-OSS 120B	$0.0015	1.5m	61%	100	100	100	100	100	100	98	92	50	50	89%
52	Qwen 3.5 Plus (2026-04-20)	$0.023	2.4m	71%	100	100	100	100	99	97	87	68	68	68	89%
26	Qwen 3.6 35B	$0.0075	53.0s	62%	100	100	100	100	100	100	95	83	68	40	89%
10	Claude Opus 4.7	$0.011	7.5s	82%	93	92	92	91	89	89	89	86	82	80	88%
11	Claude Sonnet 4.6	$0.0045	8.0s	71%	99	99	98	94	89	86	85	76	75	73	87%
48	Qwen 3.5 Flash	$0.0060	1.7m	58%	100	100	100	100	100	100	100	68	50	48	87%
19	Claude Opus 4.7 (Reasoning)	$0.011	7.2s	63%	100	100	96	96	89	86	83	80	79	51	86%
31	Inception Mercury	$0.0002	8.2s	46%	100	100	100	100	100	100	100	86	50	18	85%
61	Z.AI GLM 4.7	$0.010	2.7m	59%	100	100	100	100	98	87	84	76	55	50	85%
18	Claude Sonnet 4.5	$0.0046	7.8s	62%	100	97	96	91	86	82	80	80	76	52	84%
68	Qwen 3.5 35B	$0.028	1.9m	45%	100	100	100	100	100	100	98	68	50	18	83%
17	Claude Sonnet 4	$0.0046	7.5s	64%	95	95	95	94	92	92	83	72	60	53	83%
25	Claude Opus 4.6	$0.0079	9.7s	57%	100	100	100	99	99	95	68	58	54	49	82%
62	DeepSeek V4 Pro (Reasoning)	$0.0047	2.3m	51%	100	100	100	100	100	100	83	50	49	38	82%
32	GPT-5.4 Nano (Reasoning, Low)	$0.0025	15.4s	52%	100	100	100	100	99	91	72	50	50	46	81%
80	Qwen 3.5 9B	$0.0021	3.2m	46%	100	100	100	100	100	99	72	68	50	19	81%
51	Claude Opus 4	$0.025	18.4s	49%	100	96	95	95	85	73	70	67	55	41	78%
29	Gemma 4 31B	$0.0001	17.6s	59%	91	90	89	83	79	68	68	68	66	65	77%
46	Claude Haiku 4.5	$0.0016	4.4s	43%	100	100	99	96	95	94	68	50	32	30	76%
67	MiniMax M2.5	$0.0091	1.6m	41%	100	100	100	100	76	68	68	56	50	42	76%
53	GPT-5.4 Mini (Reasoning)	$0.013	16.8s	41%	100	100	100	100	77	68	60	50	50	50	75%
37	Gemini 3 Flash (Preview)	$0.0008	3.1s	52%	99	95	68	68	68	68	68	67	67	64	73%
34	Gemini 3.1 Flash Lite (Reasoning)	$0.0004	2.2s	56%	98	68	68	68	68	68	68	68	68	68	71%
70	Gemini 3 Pro (Preview)	$0.031	21.8s	32%	100	100	100	98	68	68	66	52	40	20	71%
33	Gemini 3.1 Flash Lite (Preview)	$0.0004	2.0s	56%	98	68	68	68	68	68	68	68	68	68	71%
77	ByteDance Seed 2.0 Mini	$0.0024	2.6m	48%	98	94	76	76	72	68	67	57	50	50	71%
43	Gemma 4 26B	$0.0001	6.8s	50%	96	88	84	82	80	78	64	51	49	37	71%
79	Z.AI GLM 5	$0.0082	1.4m	33%	99	93	93	91	64	50	50	50	48	47	68%
64	Gemini 2.5 Pro	$0.020	17.2s	36%	100	97	95	71	64	57	51	50	50	48	68%
24	Gemini 3.1 Flash Lite	$0.0004	5.2s	68%	68	68	68	68	68	68	68	68	68	67	68%
69	ByteDance Seed 2.0 Lite	$0.0033	38.7s	27%	99	99	95	91	60	53	51	50	46	18	66%
54	GPT-5.4	$0.0045	9.5s	40%	94	92	84	63	62	60	53	51	47	46	65%
94	ByteDance Seed 1.6	$0.0075	1.4m	25%	100	100	87	53	50	50	49	49	42	18	60%
75	Gemma 3 12B	$0.0001	6.2s	20%	97	94	90	83	82	67	44	9	7	3	58%
66	Qwen 3.5 Plus (2026-02-15)	$0.0007	12.0s	36%	74	72	72	68	66	56	44	36	19	18	53%
59	GPT-4o, Aug. 6th (temp=1)	$0.0031	3.9s	44%	68	54	50	50	50	50	50	49	49	47	52%
74	GPT-5.4 Mini (Reasoning, Low)	$0.0020	3.6s	30%	99	60	50	50	49	47	43	35	34	28	50%
56	GPT-4o Mini (temp=0)	$0.0002	5.4s	49%	50	50	50	50	50	50	50	49	49	45	49%
57	GPT-4o Mini (temp=1)	$0.0002	4.8s	48%	50	50	50	50	50	50	50	50	49	43	49%
58	GPT-4.1	$0.0025	5.5s	48%	51	50	50	50	50	50	50	49	48	44	49%
78	Grok 4.1 Fast	$0.0003	9.0s	28%	100	50	50	47	47	41	38	38	38	34	48%
63	GPT-4o, Aug. 6th (temp=0)	$0.0031	4.2s	44%	50	50	50	50	50	50	50	49	49	30	48%
90	Z.AI GLM 4.7 Flash	$0.0013	56.4s	31%	80	55	50	50	50	49	48	45	34	0	46%
97	Ministral 3 3B	$0.0000	1.3s	9%	98	98	92	70	50	34	9	5	5	0	46%
93	Gemini 2.5 Flash Lite (Reasoning)	$0.0012	13.0s	16%	96	95	60	53	52	50	47	0	0	0	45%
96	DeepSeek V3.2	$0.0005	29.1s	19%	99	92	50	50	50	48	38	14	10	1	45%
81	Grok 4	$0.0086	19.5s	35%	50	50	50	50	50	50	50	48	43	0	44%
99	Mistral Small 4 (Reasoning)	$0.0025	28.0s	17%	100	81	59	50	50	48	43	2	0	0	43%
73	Grok 4 Fast	$0.0003	5.0s	36%	50	50	49	49	49	47	47	43	41	7	43%
72	Llama 3.1 70B	$0.0003	3.7s	37%	50	50	49	49	49	47	45	41	34	14	43%
71	GPT-4.1 Nano	$0.0001	3.6s	38%	50	50	50	49	48	43	43	34	30	26	42%
87	Arcee AI: Trinity Large (Preview)	$0.0000	6.7s	24%	91	49	49	49	47	38	34	23	14	14	41%
104	Aion 2.0	$0.0014	21.8s	12%	100	91	72	49	48	44	2	0	0	0	41%
113	Z.AI GLM 4.6	$0.0043	1.2m	20%	97	76	50	50	50	50	24	11	0	0	41%
89	Qwen3 235B A22B Instruct 2507	$0.0002	9.6s	23%	92	50	49	47	43	42	39	21	18	0	40%
102	Claude 3.5 Sonnet	$0.0048	13.3s	17%	97	71	50	43	43	41	38	5	3	0	39%
111	Xiaomi MIMO v2.5 Pro	$0.0059	26.8s	11%	100	100	50	50	49	38	0	0	0	0	39%
83	Grok 4.20 (Beta)	$0.0017	2.2s	30%	50	50	50	49	48	45	43	26	10	1	37%
84	GPT-4.1 Mini	$0.0005	3.7s	30%	50	50	50	50	49	43	42	22	14	0	37%
91	DeepSeek V4 Flash (Reasoning)	$0.0001	26.4s	29%	50	50	48	44	41	41	38	30	18	4	36%
100	Z.AI GLM 4.5	$0.0006	6.0s	16%	87	76	55	47	45	38	14	0	0	0	36%
85	Claude 3 Haiku	$0.0004	3.0s	30%	49	49	49	49	48	47	43	22	5	0	36%
92	DeepSeek V3 (2025-03-24)	$0.0003	12.3s	26%	56	50	50	49	45	38	38	30	2	0	36%
101	LFM2 24B	$0.0000	7.0s	17%	79	64	50	49	38	30	30	7	3	0	35%
88	DeepSeek V4 Flash	$0.0001	5.8s	28%	50	50	50	50	47	43	34	22	0	0	34%
116	Xiaomi MIMO v2.5	$0.0035	17.0s	4%	98	97	63	50	30	5	0	0	0	0	34%
109	Mistral Large	$0.0090	7.8s	15%	85	59	55	52	49	22	8	7	0	0	34%
98	GPT-4o, May 13th (temp=1)	$0.0050	13.1s	26%	50	50	50	48	47	43	34	3	0	0	32%
106	Stealth: Hunter Alpha	$0.0000	11.2s	16%	85	50	44	41	34	26	22	22	0	0	32%
95	Llama 3.1 8B	$0.0001	1.4s	25%	52	50	50	49	48	38	26	3	1	0	32%
108	DeepSeek V3.1	$0.0003	22.7s	20%	50	49	48	45	34	30	26	10	1	1	29%
105	Gemini 2.5 Flash	$0.0008	2.3s	19%	50	48	47	45	38	22	18	14	1	0	28%
118	Gemini 2.5 Flash (Reasoning)	$0.011	19.6s	15%	64	50	50	43	30	26	12	0	0	0	27%
103	GPT-5.4 Mini	$0.0014	2.3s	23%	50	47	41	41	38	38	18	1	0	0	27%
110	Grok 4.20	$0.0008	4.9s	16%	50	50	50	49	41	18	11	2	0	0	27%
107	Hermes 3 405B	$0.0000	16.5s	21%	50	50	45	41	38	34	7	5	0	0	27%
117	DeepSeek V3 (2024-12-26)	$0.0004	11.6s	8%	74	50	50	47	17	14	14	3	0	0	27%
115	Writer: Palmyra X5	$0.0023	14.1s	13%	66	50	49	47	36	14	1	0	0	0	26%
112	Mistral Small 4	$0.0002	3.8s	15%	53	50	48	40	38	15	4	0	0	0	25%
114	Gemini 2.5 Flash Lite	$0.0001	1.5s	12%	50	50	50	49	47	0	0	0	0	0	25%
120	Stealth: Healer Alpha	$0.0000	34.3s	17%	50	47	41	31	26	26	14	1	0	0	23%
125	Hermes 3 70B	$0.0002	13.2s	4%	75	50	48	43	14	3	1	0	0	0	23%
123	GPT-4o, May 13th (temp=0)	$0.0052	9.1s	9%	50	49	49	41	22	10	0	0	0	0	22%
122	Mistral Medium 3.1	$0.0007	7.6s	7%	50	48	47	43	18	7	3	0	0	0	22%
126	Rocinante 12B	$0.0002	15.4s	6%	50	49	49	45	22	0	0	0	0	0	22%
124	Qwen 2.5 72B	$0.0002	9.9s	6%	50	50	45	43	18	5	1	0	0	0	21%
119	Grok 4.3	$0.0006	3.4s	11%	50	50	37	32	18	16	7	1	0	0	21%
121	DeepSeek-V2 Chat	$0.0001	17.3s	11%	50	48	47	22	18	18	5	0	0	0	21%
130	Mistral Large 3	$0.0005	7.6s	0%	50	49	49	48	0	0	0	0	0	0	20%
132	Qwen 3 32B	$0.0004	14.8s	0%	98	50	38	10	0	0	0	0	0	0	20%
129	Mistral NeMO	$0.0001	5.4s	0%	69	50	50	26	0	0	0	0	0	0	19%
135	DeepSeek V4 Pro	$0.0006	24.2s	1%	62	51	48	26	3	2	2	0	0	0	19%
131	Z.AI GLM 4.5 Air	$0.0006	18.0s	4%	50	47	30	26	14	0	0	0	0	0	17%
133	GPT-5.4 Nano	$0.0004	2.7s	0%	59	50	47	4	0	0	0	0	0	0	16%
127	Mistral Small 3.2 24B	$0.0001	6.5s	5%	50	43	30	18	7	7	5	0	0	0	16%
128	Claude 3.7 Sonnet	$0.0043	7.3s	8%	41	34	22	22	14	7	5	3	1	1	15%
136	Ministral 3 8B	$0.0001	2.6s	0%	50	49	34	0	0	0	0	0	0	0	13%
138	Llama 3.1 Nemotron 70B	$0.0001	11.6s	1%	50	49	22	5	5	0	0	0	0	0	13%
137	Gemma 3 4B	$0.0000	3.2s	1%	50	49	14	3	2	1	0	0	0	0	12%
134	Ministral 3B	$0.0000	1.9s	4%	47	26	22	10	10	0	0	0	0	0	11%
139	Ministral 3 14B	$0.0001	3.5s	0%	50	22	22	5	0	0	0	0	0	0	10%
140	Gemma 3 27B	$0.0001	8.4s	0%	43	41	7	3	0	0	0	0	0	0	9%
142	ByteDance Seed 1.6 Flash	$0.0005	9.8s	0%	43	30	0	0	0	0	0	0	0	0	7%
141	Ministral 8B	$0.0000	2.7s	0%	49	14	0	0	0	0	0	0	0	0	6%
144	Mistral Large 2	$0.0017	7.5s	0%	14	10	1	1	0	0	0	0	0	0	2%
146	Cohere Command R+ (Aug. 2024)	$0.0034	8.5s	0%	14	2	0	0	0	0	0	0	0	0	2%
143	Mistral Small Creative	$0.0001	2.3s	0%	2	0	0	0	0	0	0	0	0	0	0%
147	WizardLM 2 8x22b	$0.0005	14.0s	0%	0	0	0	0	0	0	0	0	0	0	0%
145	Arcee AI: Trinity Mini	$0.0001	5.1s	0%	0	0	0	0	0	0	0	0	0	0	0%
57.50%

Median	Evaluator	Top 3	Flop 3
49.7%	Dialogue to Total Word Ratio	100Gemini 3.1 Pro (Preview) 100Z.AI GLM 5.1 100Z.AI GLM 5 Turbo	0GPT-4.1 Nano 0GPT-4o Mini (temp=0) 0Arcee AI: Trinity Mini
73.6%	Matches word count	100GPT-5.1 100Grok 4.3 (Reasoning) 100GPT-5	0Arcee AI: Trinity Mini 0WizardLM 2 8x22b 0Grok 4.3

Dialogue tags

Write 200 words with 10% dialogue

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)