Write 200 words with 50% dialogue

Dialogue tags

Various tasks related to dialogue tags in text.

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Qwen3.7 Max	100%
Gemini 3.1 Pro (Preview)	100%
Gemini 3.5 Flash (Reasoning)	100%
GPT-5.4 (Reasoning)	100%
GPT-5.5 (Reasoning)	100%
Z.AI GLM 5.2 (Reasoning, High)	100%
Qwen 3.6 35B	100%
Qwen 3.5 397B A17B	99%
Claude Sonnet 4.6 (Reasoning)	99%
Z.AI GLM 5 Turbo	98%
GPT-5.5 (Reasoning, Low)	98%
Z.AI GLM 5.1	98%
Qwen 3.5 27B	98%
MiniMax M2.5	98%
Qwen 3.5 35B	97%
Inception Mercury 2	97%
GPT-OSS 120B	97%
MiniMax M2.7	96%
Gemma 4 31B (Reasoning)	96%
GPT-5	95%

	Score	Cost	Time
Inception Mercury 2	97%	$0.0031	5.3s
Stealth: Aurora Alpha	85%	—	7.2s
GPT-5.5	91%	$0.0094	8.9s
GPT-5.4 Nano (Reasoning)	95%	$0.0072	34.0s
GPT-5.4 Nano (Reasoning, Low)	80%	$0.0027	15.2s
GPT-5 Mini	90%	$0.0084	50.9s
Claude Opus 4.6 (Reasoning)	90%	$0.034	20.9s
GPT-OSS 120B	97%	$0.0012	2.6m
GPT-5.4 (Reasoning, Low)	83%	$0.018	19.5s
Gemini 3 Flash (Preview, Reasoning)	87%	$0.024	39.7s
Claude Opus 4.6	79%	$0.0081	9.6s
Qwen 3.6 35B	100%	$0.015	1.3m
GPT-5.4 (Reasoning)	100%	$0.042	47.1s
GPT-5.1	95%	$0.038	1.1m
GPT-5.5 (Reasoning, Low)	98%	$0.041	23.6s
Nemotron 3 Super	90%	$0.0000	2.7m
GPT-4o, Aug. 6th (temp=0)	83%	$0.0031	4.0s
Z.AI GLM 5 Turbo	98%	$0.028	1.3m
GPT-5.2	90%	$0.038	48.2s
o4 Mini	89%	$0.027	1.1m

	Score	Cost	Speed	Stability
Inception Mercury 2	97%	$0.0031	5.3s	86%
Qwen 3.6 35B	100%	$0.015	1.3m	99%
GPT-5.5 (Reasoning, Low)	98%	$0.041	23.6s	95%
GPT-5.4 (Reasoning)	100%	$0.042	47.1s	100%
GPT-5.5	91%	$0.0094	8.9s	74%
GPT-5.4 Nano (Reasoning)	95%	$0.0072	34.0s	70%
Z.AI GLM 5 Turbo	98%	$0.028	1.3m	90%
Z.AI GLM 5.2 (Reasoning, High)	100%	$0.037	1.8m	99%
GPT-4o, Aug. 6th (temp=0)	83%	$0.0031	4.0s	62%
Qwen 3.5 35B	97%	$0.032	1.7m	91%
Qwen 3.5 27B	98%	$0.028	2.0m	92%
GPT-OSS 120B	97%	$0.0012	2.6m	83%
GPT-5.5 (Reasoning)	100%	$0.083	39.8s	99%
GPT-5 Mini	90%	$0.0084	50.9s	60%
Qwen3.7 Max	100%	$0.061	2.0m	100%
Claude Opus 4.6 (Reasoning)	90%	$0.034	20.9s	64%
GPT-5.4 Nano (Reasoning, Low)	80%	$0.0027	15.2s	52%
Gemini 3.5 Flash (Reasoning)	100%	$0.097	40.6s	100%
GPT-5.4 (Reasoning, Low)	83%	$0.018	19.5s	59%
Z.AI GLM 5.1	98%	$0.036	2.5m	90%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	# 6	# 7	# 8	# 9	# 10	Total
15	Qwen3.7 Max	$0.061	2.0m	100%	100	100	100	100	100	100	100	100	100	100	100%
35	Gemini 3.1 Pro (Preview)	$0.111	1.4m	100%	100	100	100	100	100	100	100	100	100	100	100%
18	Gemini 3.5 Flash (Reasoning)	$0.097	40.6s	100%	100	100	100	100	100	100	100	100	100	100	100%
4	GPT-5.4 (Reasoning)	$0.042	47.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
13	GPT-5.5 (Reasoning)	$0.083	39.8s	99%	100	100	100	100	100	100	100	100	100	99	100%
8	Z.AI GLM 5.2 (Reasoning, High)	$0.037	1.8m	99%	100	100	100	100	100	100	100	100	100	99	100%
2	Qwen 3.6 35B	$0.015	1.3m	99%	100	100	100	100	100	100	100	99	99	98	100%
56	Qwen 3.5 397B A17B	$0.043	5.0m	92%	100	100	100	100	100	100	100	100	99	87	99%
81	Claude Sonnet 4.6 (Reasoning)	$0.152	1.7m	95%	100	100	100	100	100	99	99	99	97	93	99%
7	Z.AI GLM 5 Turbo	$0.028	1.3m	90%	100	100	100	100	100	100	100	100	99	83	98%
3	GPT-5.5 (Reasoning, Low)	$0.041	23.6s	95%	100	100	100	99	99	99	98	97	95	95	98%
20	Z.AI GLM 5.1	$0.036	2.5m	90%	100	100	100	100	100	100	100	100	97	83	98%
11	Qwen 3.5 27B	$0.028	2.0m	92%	100	100	100	100	100	100	100	98	94	87	98%
27	MiniMax M2.5	$0.018	3.4m	86%	100	100	100	100	100	100	100	100	100	76	98%
10	Qwen 3.5 35B	$0.032	1.7m	91%	100	100	100	100	100	100	100	95	94	86	97%
1	Inception Mercury 2	$0.0031	5.3s	86%	100	100	100	100	100	100	100	98	95	76	97%
12	GPT-OSS 120B	$0.0012	2.6m	83%	100	100	100	100	100	100	100	99	97	71	97%
39	MiniMax M2.7	$0.020	4.0m	77%	100	100	100	100	100	100	100	99	99	62	96%
67	Gemma 4 31B (Reasoning)	$0.0034	6.4m	82%	100	100	100	100	100	100	100	100	88	71	96%
29	GPT-5	$0.046	1.2m	70%	100	100	100	100	100	100	100	100	100	50	95%
108	Qwen3.6 Max Preview	$0.076	4.4m	70%	100	100	100	100	100	100	100	100	100	50	95%
52	Grok 4.3 (Reasoning)	$0.040	3.2m	70%	100	100	100	100	100	100	100	100	100	50	95%
6	GPT-5.4 Nano (Reasoning)	$0.0072	34.0s	70%	100	100	100	100	100	100	100	100	99	50	95%
21	GPT-5.1	$0.038	1.1m	70%	100	100	100	100	100	100	100	100	96	50	95%
5	GPT-5.5	$0.0094	8.9s	74%	100	100	100	100	99	99	93	90	76	60	91%
24	Grok 4.20 (Beta, Reasoning)	$0.051	35.2s	71%	100	100	100	100	99	98	91	87	86	53	91%
26	GPT-5.2	$0.038	48.2s	67%	100	100	100	100	100	100	99	82	71	50	90%
16	Claude Opus 4.6 (Reasoning)	$0.034	20.9s	64%	100	100	100	99	99	99	98	95	61	50	90%
14	GPT-5 Mini	$0.0084	50.9s	60%	100	100	100	100	100	100	100	100	50	50	90%
34	Nemotron 3 Super	$0.0000	2.7m	60%	100	100	100	100	100	99	99	98	50	50	90%
117	Gemma 4 26B (Reasoning)	$0.0044	5.8m	40%	100	100	100	100	100	100	100	100	95	0	89%
30	o4 Mini	$0.027	1.1m	61%	100	100	100	100	100	99	94	93	50	50	89%
47	MoonshotAI: Kimi K2.5	$0.024	3.2m	67%	100	100	100	97	95	94	90	80	80	50	89%
44	Grok 4.20 (Reasoning)	$0.032	2.3m	63%	100	100	98	98	96	90	88	88	66	47	87%
25	Gemini 3 Flash (Preview, Reasoning)	$0.024	39.7s	59%	100	100	100	100	100	100	100	64	54	50	87%
101	MoonshotAI: Kimi K2.6	$0.039	3.9m	55%	100	100	100	100	100	99	98	72	51	38	86%
28	Stealth: Aurora Alpha	—	7.2s	54%	100	100	100	100	99	99	98	50	50	50	85%
50	o4 Mini High	$0.039	1.6m	54%	100	100	100	100	99	99	98	50	50	50	85%
19	GPT-5.4 (Reasoning, Low)	$0.018	19.5s	59%	100	100	100	100	99	96	67	66	53	52	83%
9	GPT-4o, Aug. 6th (temp=0)	$0.0031	4.0s	62%	100	100	99	90	89	86	71	71	64	60	83%
60	Qwen 3.5 Plus (2026-04-20)	$0.022	2.3m	49%	100	100	100	100	99	95	84	50	50	34	81%
33	Qwen 3.6 Flash	$0.018	57.0s	54%	100	100	100	98	97	94	69	52	50	48	81%
17	GPT-5.4 Nano (Reasoning, Low)	$0.0027	15.2s	52%	100	100	100	100	99	95	59	53	50	45	80%
64	Qwen 3.5 122B	$0.042	1.5m	48%	100	100	100	99	98	72	64	63	51	43	79%
23	Claude Opus 4.6	$0.0081	9.6s	49%	100	100	100	100	93	93	51	51	49	49	79%
133	MiniMax M3	$0.016	5.2m	34%	100	100	100	100	100	90	80	50	50	0	77%
22	Claude Sonnet 4.6	$0.0048	7.9s	48%	98	97	95	95	94	76	70	59	45	39	77%
32	GPT-5.4 Mini (Reasoning)	$0.014	16.0s	46%	100	99	98	96	88	70	62	50	50	50	76%
96	Z.AI GLM 4.7	$0.0090	3.1m	39%	100	100	100	100	98	95	54	50	48	14	76%
42	Gemini 3 Pro (Preview)	$0.031	21.0s	44%	100	100	99	99	90	82	49	48	45	45	76%
100	Nemotron 3 Nano	$0.0031	3.8m	41%	100	100	100	98	73	72	65	50	50	44	75%
31	Inception Mercury	$0.0002	9.8s	41%	100	100	99	97	87	77	50	47	41	40	74%
55	Gemini 2.5 Pro	$0.036	29.5s	47%	93	90	89	84	76	73	67	60	44	36	71%
85	Qwen 3.5 Flash	$0.0067	2.0m	31%	100	100	100	97	95	57	45	39	31	30	69%
156	DeepSeek V4 Pro (Reasoning)	$0.030	5.5m	26%	100	100	100	100	60	50	50	50	43	34	69%
43	GPT-4o, May 13th (temp=0)	$0.0051	9.6s	33%	100	97	83	82	81	72	64	50	41	1	67%
45	Claude Opus 4.5	$0.0084	9.8s	33%	99	95	93	79	67	49	48	48	47	45	67%
41	Mistral Small 4	$0.0002	3.5s	31%	98	95	89	80	79	64	55	50	42	0	65%
120	Qwen 3.6 27B	$0.032	2.3m	26%	100	99	96	86	84	75	50	39	16	3	65%
88	GPT-5 Nano	$0.0039	1.6m	28%	100	100	96	50	50	50	50	50	50	50	65%
95	Z.AI GLM 4.6	$0.0057	1.6m	26%	100	98	86	84	65	60	52	50	39	0	63%
49	GPT-4o, Aug. 6th (temp=1)	$0.0032	4.0s	30%	100	95	82	50	50	50	50	50	50	49	63%
54	Claude Opus 4.7 (Reasoning)	$0.012	7.6s	34%	93	80	79	79	54	50	50	49	49	43	63%
68	Mistral Large	$0.0086	8.2s	21%	100	99	91	86	80	59	57	51	0	0	62%
48	Grok 4.1 Fast	$0.0003	8.4s	30%	98	94	81	69	64	60	53	50	50	3	62%
97	ByteDance Seed 1.6	$0.0088	1.6m	29%	99	91	70	69	69	51	50	50	47	0	60%
127	ByteDance Seed 2.0 Mini	$0.0032	3.5m	23%	100	97	87	59	53	52	50	50	41	0	59%
83	Gemini 2.5 Flash (Reasoning)	$0.013	21.0s	23%	100	98	77	50	50	50	50	50	49	0	57%
121	Z.AI GLM 5	$0.016	2.6m	28%	96	80	72	55	50	49	47	44	40	16	55%
62	GPT-5.4	$0.0049	10.0s	29%	99	87	61	52	50	50	43	41	34	33	55%
65	Mistral Large 3	$0.0005	7.3s	24%	100	99	58	50	49	45	41	38	32	26	54%
78	Hermes 3 405B	$0.0000	17.9s	22%	96	85	82	55	54	51	41	26	22	1	51%
71	LFM2 24B	$0.0000	7.0s	25%	95	94	59	50	50	47	39	34	27	18	51%
59	Mistral Medium 3.1	$0.0006	8.3s	31%	85	64	57	54	51	51	50	50	50	1	51%
53	Claude Opus 4.8 (Reasoning, Low)	$0.014	10.0s	48%	55	50	50	50	50	50	50	50	50	50	51%
51	Claude Opus 4.8 (Reasoning)	$0.013	11.5s	50%	50	50	50	50	50	50	50	50	50	50	50%
36	Gemini 3.1 Flash Lite (Reasoning)	$0.0004	3.1s	50%	50	50	50	50	50	50	50	50	50	49	50%
37	Gemini 3.1 Flash Lite (Preview)	$0.0004	2.1s	49%	50	50	50	50	50	50	50	50	49	48	50%
38	Gemini 3.1 Flash Lite	$0.0004	4.4s	49%	50	50	50	50	50	50	50	50	49	48	50%
40	GPT-4o Mini (temp=1)	$0.0002	5.0s	49%	50	50	50	50	50	50	50	49	49	45	49%
82	Llama 3.1 8B	$0.0001	1.4s	18%	99	99	61	53	50	50	49	22	7	0	49%
58	DeepSeek V3 (2025-03-24)	$0.0004	11.2s	35%	72	63	56	55	51	50	50	43	38	10	49%
80	Claude Haiku 4.5	$0.0016	4.3s	21%	92	88	70	60	60	45	34	22	12	0	48%
66	DeepSeek V3 (2024-12-26)	$0.0004	11.9s	31%	70	68	64	56	51	50	41	41	37	0	48%
46	Grok 4.20	$0.0008	5.5s	45%	50	50	50	50	50	50	50	50	43	34	48%
63	Arcee AI: Trinity Large (Preview)	$0.0000	11.0s	33%	85	50	50	50	47	45	43	38	34	28	47%
98	ByteDance Seed 1.6 Flash	$0.0007	13.5s	14%	100	99	76	50	49	45	41	4	2	0	47%
87	Hermes 3 70B	$0.0001	13.6s	23%	100	64	58	54	52	47	42	25	10	2	45%
61	GPT-4.1	$0.0026	5.0s	36%	50	50	50	50	50	50	50	49	49	5	45%
79	GPT-5.4 Mini (Reasoning, Low)	$0.0022	3.3s	26%	82	64	61	55	52	50	43	34	5	1	45%
92	Mistral Small 4 (Reasoning)	$0.0012	16.0s	22%	98	72	54	50	50	49	44	21	7	1	44%
57	GPT-4o Mini (temp=0)	$0.0002	5.1s	40%	50	50	50	49	48	45	43	43	34	30	44%
69	Claude Opus 4.7	$0.012	7.9s	40%	50	49	49	45	45	45	43	43	41	30	44%
77	Claude 3 Haiku	$0.0004	3.1s	26%	74	71	61	51	49	41	41	30	14	10	44%
84	GPT-5.4 Mini	$0.0014	2.2s	24%	90	69	49	47	44	43	41	34	10	10	44%
93	Ministral 3 14B	$0.0001	3.2s	19%	95	86	50	50	49	48	40	10	4	0	43%
86	GPT-4.1 Mini	$0.0005	5.1s	23%	98	50	49	49	47	45	41	41	10	0	43%
72	DeepSeek-V2 Chat	$0.0001	18.5s	35%	50	50	50	50	50	50	47	43	41	0	43%
90	GPT-4o, May 13th (temp=1)	$0.0051	8.9s	25%	88	50	50	50	50	49	47	44	0	0	43%
73	Stealth: Hunter Alpha	$0.0000	11.8s	34%	53	50	50	50	49	49	47	38	34	0	42%
91	Llama 3.1 70B	$0.0003	3.5s	21%	92	66	50	45	43	38	34	26	18	5	42%
70	GPT-4.1 Nano	$0.0001	3.4s	34%	50	50	50	49	48	48	45	43	30	0	41%
75	Grok 4.20 (Beta)	$0.0018	2.2s	33%	50	50	50	50	49	47	43	38	26	0	40%
89	Xiaomi MIMO v2.5	$0.0027	13.8s	28%	66	57	50	50	50	50	50	26	0	0	40%
74	DeepSeek V4 Flash	$0.0001	5.1s	34%	50	49	49	49	49	48	47	30	22	3	40%
76	Gemini 3 Flash (Preview)	$0.0009	3.2s	33%	50	50	49	49	49	45	45	34	10	10	39%
106	Gemini 2.5 Flash Lite (Reasoning)	$0.0018	19.6s	18%	99	50	50	50	50	30	28	24	4	0	39%
109	Skyfall 36B V2	$0.0003	6.0s	10%	100	91	51	49	32	30	18	1	0	0	37%
94	Gemini 3.5 Flash (Reasoning, Minimal)	$0.0024	2.6s	28%	51	50	49	49	47	43	43	24	1	0	36%
102	Cohere Command R+ (Aug. 2024)	$0.0035	7.3s	23%	71	50	50	49	46	42	36	2	0	0	35%
116	ByteDance Seed 2.0 Lite	$0.0024	28.3s	12%	100	70	50	50	47	27	0	0	0	0	34%
105	Grok 4	$0.0082	19.1s	27%	50	50	50	50	49	38	30	22	3	2	34%
111	DeepSeek V3.2	$0.0008	59.4s	26%	50	49	47	43	38	34	34	22	18	7	34%
137	Qwen 3.5 9B	$0.0016	2.3m	20%	67	59	51	50	42	34	34	0	0	0	34%
104	Ministral 3B	$0.0000	1.5s	20%	76	50	48	47	46	34	18	0	0	0	32%
99	Grok 4 Fast	$0.0003	4.8s	25%	49	49	48	46	45	30	21	18	8	5	32%
115	Qwen 3.5 Plus (2026-02-15)	$0.0008	12.7s	10%	100	60	50	42	34	18	14	2	0	0	32%
103	Stealth: Healer Alpha	$0.0000	10.3s	24%	52	50	50	49	44	38	31	2	2	2	32%
112	Mistral Small Creative	$0.0001	2.3s	13%	83	53	50	49	46	14	14	1	0	0	31%
138	Z.AI GLM 4.7 Flash	$0.0022	1.6m	12%	82	64	53	50	30	28	0	0	0	0	31%
107	Qwen 3 32B	$0.0003	14.1s	24%	56	50	50	46	44	40	10	7	0	0	30%
123	Claude Opus 4	$0.026	16.8s	24%	49	45	43	41	38	38	22	7	1	0	28%
113	DeepSeek V3.1	$0.0003	14.7s	16%	61	50	50	41	34	20	14	10	3	0	28%
110	GPT-5.4 Nano	$0.0004	2.3s	19%	50	49	47	44	34	30	6	2	0	0	26%
119	Qwen 2.5 72B	$0.0001	8.2s	12%	50	50	49	49	26	13	10	7	5	0	26%
118	Gemini 2.5 Flash Lite	$0.0001	1.6s	10%	66	50	50	49	38	4	0	0	0	0	26%
114	Gemma 4 31B	$0.0001	14.6s	18%	45	45	43	26	26	26	22	10	7	1	25%
128	Claude Sonnet 4	$0.0046	7.2s	7%	71	53	45	23	20	7	5	1	0	0	23%
122	Mistral Small 3.2 24B	$0.0001	5.6s	11%	50	50	49	34	30	7	0	0	0	0	22%
129	DeepSeek V4 Pro	$0.0007	17.6s	8%	50	49	48	43	24	3	0	0	0	0	22%
124	Claude 3.5 Sonnet	$0.0050	17.4s	15%	46	40	34	27	26	18	15	1	0	0	21%
125	Rocinante 12B	$0.0003	23.5s	12%	48	44	40	25	23	17	2	0	0	0	20%
131	DeepSeek V4 Flash (Reasoning)	$0.0001	21.3s	6%	50	50	41	22	14	7	5	1	0	0	19%
136	Writer: Palmyra X5	$0.0022	6.8s	2%	50	49	45	29	5	2	0	0	0	0	18%
132	Claude Sonnet 4.5	$0.0049	7.6s	6%	55	50	26	14	10	10	7	5	1	0	18%
130	Ministral 3 8B	$0.0001	2.5s	5%	50	39	34	33	8	7	6	1	0	0	18%
126	Gemma 4 26B	$0.0001	10.6s	11%	45	43	26	22	18	14	5	3	0	0	18%
141	Z.AI GLM 4.5 Air	$0.0004	15.3s	0%	82	49	30	14	0	0	0	0	0	0	17%
147	Aion 2.0	$0.0013	20.6s	0%	73	47	43	10	0	0	0	0	0	0	17%
140	Qwen3 235B A22B Instruct 2507	$0.0002	13.3s	0%	50	50	38	34	0	0	0	0	0	0	17%
139	Mistral NeMO	$0.0000	3.5s	0%	53	50	40	19	1	0	0	0	0	0	16%
135	Llama 3.1 Nemotron 70B	$0.0001	9.1s	4%	50	39	36	17	12	1	0	0	0	0	15%
148	Xiaomi MIMO v2.5 Pro	$0.0015	12.3s	0%	62	49	34	1	0	0	0	0	0	0	15%
134	Claude 3.7 Sonnet	$0.0050	6.8s	9%	41	30	22	18	14	10	3	2	1	0	14%
144	Ministral 8B	$0.0000	3.9s	1%	48	47	16	8	2	2	0	0	0	0	12%
145	WizardLM 2 8x22b	$0.0004	14.0s	4%	40	28	21	20	8	3	1	0	0	0	12%
142	Gemini 2.5 Flash	$0.0008	2.4s	2%	50	50	7	5	5	3	0	0	0	0	12%
146	Cydonia 24B V4.1	$0.0002	7.6s	2%	49	38	14	7	5	2	2	0	0	0	12%
143	Ministral 3 3B	$0.0000	1.3s	3%	50	34	7	7	5	3	1	0	0	0	11%
150	Mistral Large 2	$0.0018	6.7s	0%	49	14	3	1	0	0	0	0	0	0	7%
149	Z.AI GLM 4.5	$0.0005	5.7s	1%	26	12	10	10	2	1	1	0	0	0	6%
151	Arcee AI: Trinity Mini	$0.0001	5.2s	0%	50	0	0	0	0	0	0	0	0	0	5%
152	Gemma 3 12B	$0.0001	6.5s	0%	41	4	1	0	0	0	0	0	0	0	5%
153	Grok 4.3	$0.0006	3.5s	0%	26	1	0	0	0	0	0	0	0	0	3%
155	Gemma 3 27B	$0.0001	10.1s	0%	10	0	0	0	0	0	0	0	0	0	1%
154	Gemma 3 4B	$0.0000	3.3s	0%	0	0	0	0	0	0	0	0	0	0	0%
54.64%

Median	Evaluator	Top 3	Flop 3
41.8%	Dialogue to Total Word Ratio	100Gemini 3.1 Pro (Preview) 100Gemini 3.5 Flash (Reasoning) 100Qwen3.7 Max	0Gemini 3.1 Flash Lite (Preview) 0Gemini 3.1 Flash Lite (Reasoning) 0Gemma 3 4B
69.8%	Matches word count	100Qwen3.7 Max 100Gemini 3.1 Pro (Preview) 100Gemini 3.5 Flash (Reasoning)	0WizardLM 2 8x22b 0Gemma 3 4B 0Mistral Large 2

Dialogue tags

Write 200 words with 50% dialogue

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)