Avoid said/asked/replied/answered

Text Replacement

Tests deterministic text transformations: renaming characters/locations, expanding contractions, tense rewriting, POV shifts, gender swaps, combined transformations, and word avoidance. Scored by checking each expected change independently.

Text Editing

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
GPT-5.6 Sol (Reasoning)	100%
Claude Opus 4.6 (Reasoning)	100%
Qwen3.7 Max	100%
Grok 4.5 (Reasoning, High)	100%
Gemini 3.1 Pro (Preview)	100%
GPT-5.4 (Reasoning)	100%
Z.AI GLM 5.1	100%
Qwen3.6 Max Preview	100%
GPT-5.5 (Reasoning)	100%
Claude Sonnet 4.6 (Reasoning)	100%
Z.AI GLM 5.2 (Reasoning, High)	100%
Z.AI GLM 5 Turbo	100%
MoonshotAI: Kimi K2.6	100%
Claude Opus 4.7 (Reasoning)	100%
GPT-5.5 (Reasoning, Low)	100%
GPT-5.6 Terra (Reasoning)	100%
Claude Opus 4.8 (Reasoning)	100%
Claude Opus 4.6	100%
Claude Opus 4.8 (Reasoning, Low)	100%
GPT-5	100%

	Score	Cost	Time
Gemini 2.5 Flash Lite	100%	$0.0003	1.5s
Gemma 3 4B	98%	$0.0001	5.5s
Mistral Small 3.2 24B	100%	$0.0002	6.2s
Mistral Small 4	99%	$0.0004	3.1s
Gemma 3 12B	98%	$0.0001	7.4s
DeepSeek V4 Flash	98%	$0.0002	9.5s
Qwen 2.5 72B	100%	$0.0003	10.4s
Gemini 3.1 Flash Lite (Preview)	100%	$0.0009	1.7s
GPT-4o Mini (temp=1)	100%	$0.0004	9.5s
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0009	1.8s
Gemini 3.1 Flash Lite	100%	$0.0009	2.6s
GPT-4o Mini (temp=0)	100%	$0.0004	9.7s
Inception Mercury 2	100%	$0.0012	1.7s
Gemma 4 26B	100%	$0.0003	14.4s
Gemma 3 27B	100%	$0.0002	17.0s
GPT-4.1 Mini	100%	$0.0010	6.3s
GPT-5.4 Nano (Reasoning)	95%	$0.0011	4.2s
DeepSeek V4 Pro	100%	$0.0014	18.8s
Hermes 3 70B	91%	$0.0010	1.3m
Mistral Medium 3.1	100%	$0.0012	5.1s

	Score	Cost	Speed	Stability
Gemini 2.5 Flash Lite	100%	$0.0003	1.5s	100%
Gemini 3.1 Flash Lite (Preview)	100%	$0.0009	1.7s	100%
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0009	1.8s	100%
Gemini 3.1 Flash Lite	100%	$0.0009	2.6s	100%
Inception Mercury 2	100%	$0.0012	1.7s	100%
Mistral Small 3.2 24B	100%	$0.0002	6.2s	100%
Gemini 2.5 Flash	100%	$0.0014	2.0s	100%
Mistral Medium 3.1	100%	$0.0012	5.1s	100%
Gemini 3 Flash (Preview)	100%	$0.0018	3.2s	100%
GPT-4.1 Mini	100%	$0.0010	6.3s	100%
GPT-4o Mini (temp=1)	100%	$0.0004	9.5s	100%
Mistral Large 3	100%	$0.0011	7.2s	100%
GPT-4o Mini (temp=0)	100%	$0.0004	9.7s	100%
Grok 4.20	100%	$0.0019	4.4s	100%
Qwen 2.5 72B	100%	$0.0003	10.4s	100%
Qwen 3.5 Plus (2026-02-15)	100%	$0.0015	6.9s	100%
Claude Haiku 4.5	100%	$0.0034	2.7s	100%
Gemma 4 26B	100%	$0.0003	14.4s	100%
GPT-5.6 Luna	100%	$0.0036	4.0s	100%
GPT-5.6 Luna (Reasoning)	100%	$0.0043	3.4s	100%

Median	Evaluator	Top 3	Flop 3
100.0%	Forbidden words eliminated	100GPT-4.1 Mini 100Gemma 3 27B 100o4 Mini High	19GPT-4.1 Nano 24Ministral 3B 33Ministral 3 3B
100.0%	Key facts and content preserved	100Claude Opus 4.8 (Reasoning, Low) 100Claude Sonnet 4.6 (Reasoning) 100ByteDance Seed 1.6	46Cohere Command R+ (Aug. 2024) 52Ministral 3B 54Ministral 3 3B
100.0%	Structural similarity to original	100Gemini 2.5 Flash 100Qwen 3.5 Flash 100GPT-5.4	76Arcee AI: Trinity Mini 81DeepSeek V4 Flash (Reasoning) 81Aion 3.0 Mini

Text Replacement

Avoid said/asked/replied/answered

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	# 6	# 7	Total
79	GPT-5.6 Sol (Reasoning)	$0.019	4.9s	100%	100	100	100	100	100	100	100	100%
103	Claude Opus 4.6 (Reasoning)	$0.026	11.4s	100%	100	100	100	100	100	100	100	100%
114	Qwen3.7 Max	$0.026	45.8s	100%	100	100	100	100	100	100	100	100%
97	Grok 4.5 (Reasoning, High)	$0.018	29.1s	100%	100	100	100	100	100	100	100	100%
124	Gemini 3.1 Pro (Preview)	$0.037	34.3s	100%	100	100	100	100	100	100	100	100%
84	GPT-5.4 (Reasoning)	$0.017	14.4s	100%	100	100	100	100	100	100	100	100%
96	Z.AI GLM 5.1	$0.012	50.2s	100%	100	100	100	100	100	100	100	100%
136	Qwen3.6 Max Preview	$0.035	1.9m	100%	100	100	100	100	100	100	100	100%
88	GPT-5.5 (Reasoning)	$0.021	7.1s	100%	100	100	100	100	100	100	100	100%
94	Claude Sonnet 4.6 (Reasoning)	$0.021	12.6s	100%	100	100	100	100	100	100	100	100%
38	Z.AI GLM 5.2 (Reasoning, High)	$0.0046	14.8s	100%	100	100	100	100	100	100	100	100%
55	Z.AI GLM 5 Turbo	$0.0075	16.5s	100%	100	100	100	100	100	100	100	100%
135	MoonshotAI: Kimi K2.6	$0.020	2.8m	100%	100	100	100	100	100	100	100	100%
92	Claude Opus 4.7 (Reasoning)	$0.024	3.8s	100%	100	100	100	100	100	100	100	100%
82	GPT-5.5 (Reasoning, Low)	$0.019	5.9s	100%	100	100	100	100	100	100	100	100%
46	GPT-5.6 Terra (Reasoning)	$0.0098	3.9s	100%	100	100	100	100	100	100	100	100%
100	Claude Opus 4.8 (Reasoning)	$0.024	7.6s	100%	100	100	100	100	100	100	100	100%
74	Claude Opus 4.6	$0.017	5.6s	100%	100	100	100	100	100	100	100	100%
99	Claude Opus 4.8 (Reasoning, Low)	$0.024	7.1s	100%	100	100	100	100	100	100	100	100%
108	GPT-5	$0.024	32.7s	100%	100	100	100	100	100	100	100	100%
61	GPT-5 Mini	$0.0057	32.5s	100%	100	100	100	100	100	100	100	100%
126	Qwen 3.5 397B A17B	$0.013	2.2m	100%	100	100	100	100	100	100	100	100%
107	Grok 4.3 (Reasoning)	$0.014	1.1m	100%	100	100	100	100	100	100	100	100%
49	Grok 4.5 (Reasoning, Low)	$0.0080	12.1s	100%	100	100	100	100	100	100	100	100%
69	Grok 4.20 (Reasoning)	$0.0088	33.3s	100%	100	100	100	100	100	100	100	100%
131	MoonshotAI: Kimi K2.5	$0.014	2.7m	100%	100	100	100	100	100	100	100	100%
77	GPT-5.6 Sol	$0.018	6.5s	100%	100	100	100	100	100	100	100	100%
57	GPT-5.1	$0.010	10.4s	100%	100	100	100	100	100	100	100	100%
50	Claude Sonnet 4.6	$0.010	4.5s	100%	100	100	100	100	100	100	100	100%
20	GPT-5.6 Luna (Reasoning)	$0.0043	3.4s	100%	100	100	100	100	100	100	100	100%
70	MiniMax M3	$0.0029	54.6s	100%	100	100	100	100	100	100	100	100%
65	Claude Sonnet 5 (Reasoning)	$0.013	12.2s	100%	100	100	100	100	100	100	100	100%
105	Qwen 3.5 122B	$0.019	44.0s	100%	100	100	100	100	100	100	100	100%
64	Claude Sonnet 5 (Reasoning, Low)	$0.013	12.0s	100%	100	100	100	100	100	100	100	100%
104	Qwen 3.5 27B	$0.014	59.6s	100%	100	100	100	100	100	100	100	100%
89	Gemini 3 Flash (Preview, Reasoning)	$0.016	26.9s	100%	100	100	100	100	100	100	100	100%
93	Claude Opus 4.7	$0.024	4.2s	100%	100	100	100	100	100	100	100	100%
111	Qwen 3.5 Plus (2026-04-20)	$0.013	1.3m	100%	100	100	100	100	100	100	100	100%
120	Gemma 4 31B (Reasoning)	$0.0010	2.6m	100%	100	100	100	100	100	100	100	100%
73	Claude Opus 4.5	$0.017	5.4s	100%	100	100	100	100	100	100	100	100%
125	Z.AI GLM 5	$0.014	2.1m	100%	100	100	100	100	100	100	100	100%
68	ByteDance Seed 1.6	$0.0042	46.9s	100%	100	100	100	100	100	100	100	100%
41	GPT-5.2	$0.0080	5.6s	100%	100	100	100	100	100	100	100	100%
132	DeepSeek V4 Pro (Reasoning)	$0.0098	3.0m	100%	100	100	100	100	100	100	100	100%
121	Gemma 4 26B (Reasoning)	$0.0025	2.5m	100%	100	100	100	100	100	100	100	100%
118	o4 Mini High	$0.030	45.7s	100%	100	100	100	100	100	100	100	100%
130	Gemini 2.5 Pro	$0.048	36.8s	100%	100	100	100	100	100	100	100	100%
106	Qwen 3.6 27B	$0.015	59.7s	100%	100	100	100	100	100	100	100	100%
43	GPT-5.6 Terra	$0.0090	2.9s	100%	100	100	100	100	100	100	100	100%
122	Z.AI GLM 4.7	$0.0069	2.3m	100%	100	100	100	100	100	100	100	100%
63	Qwen 3.6 35B	$0.0065	33.7s	100%	100	100	100	100	100	100	100	100%
34	Z.AI GLM 4.6	$0.0032	15.1s	100%	100	100	100	100	100	100	100	100%
53	Claude Sonnet 4	$0.010	5.5s	100%	100	100	100	100	100	100	100	100%
51	Claude Sonnet 4.5	$0.010	4.7s	100%	100	100	100	100	100	100	100	100%
52	Claude Sonnet 5	$0.0094	8.3s	100%	100	100	100	100	100	100	100	100%
127	Claude Opus 4	$0.051	8.1s	100%	100	100	100	100	100	100	100	100%
95	Qwen 3.5 35B	$0.014	40.1s	100%	100	100	100	100	100	100	100	100%
26	GPT-4.1	$0.0052	4.0s	100%	100	100	100	100	100	100	100	100%
30	MiniMax M2.5	$0.0015	18.7s	100%	100	100	100	100	100	100	100	100%
85	o4 Mini	$0.016	22.7s	100%	100	100	100	100	100	100	100	100%
87	MiniMax M2.7	$0.0044	1.1m	100%	100	100	100	100	100	100	100	100%
16	Qwen 3.5 Plus (2026-02-15)	$0.0015	6.9s	100%	100	100	100	100	100	100	100	100%
47	Xiaomi MIMO v2.5 Pro	$0.0049	22.2s	100%	100	100	100	100	100	100	100	100%
3	Gemini 3.1 Flash Lite (Reasoning)	$0.0009	1.8s	100%	100	100	100	100	100	100	100	100%
24	Gemini 3.5 Flash (Reasoning, Minimal)	$0.0054	2.5s	100%	100	100	100	100	100	100	100	100%
72	Qwen 3.5 Flash	$0.0030	54.9s	100%	100	100	100	100	100	100	100	100%
9	Gemini 3 Flash (Preview)	$0.0018	3.2s	100%	100	100	100	100	100	100	100	100%
2	Gemini 3.1 Flash Lite (Preview)	$0.0009	1.7s	100%	100	100	100	100	100	100	100	100%
35	Gemma 4 31B	$0.0003	26.2s	100%	100	100	100	100	100	100	100	100%
4	Gemini 3.1 Flash Lite	$0.0009	2.6s	100%	100	100	100	100	100	100	100	100%
19	GPT-5.6 Luna	$0.0036	4.0s	100%	100	100	100	100	100	100	100	100%
18	Gemma 4 26B	$0.0003	14.4s	100%	100	100	100	100	100	100	100	100%
37	GPT-OSS 120B	$0.0004	28.4s	100%	100	100	100	100	100	100	100	100%
12	Mistral Large 3	$0.0011	7.2s	100%	100	100	100	100	100	100	100	100%
90	ByteDance Seed 2.0 Lite	$0.0058	1.1m	100%	100	100	100	100	100	100	100	100%
39	Gemini 2.5 Flash (Reasoning)	$0.0062	10.0s	100%	100	100	100	100	100	100	100	100%
21	DeepSeek-V2 Chat	$0.0008	16.8s	100%	100	100	100	100	100	100	100	100%
110	Qwen 3.5 9B	$0.0014	2.0m	100%	100	100	100	100	100	100	100	100%
40	Xiaomi MIMO v2.5	$0.0045	18.0s	100%	100	100	100	100	100	100	100	100%
17	Claude Haiku 4.5	$0.0034	2.7s	100%	100	100	100	100	100	100	100	100%
27	Gemini 2.5 Flash Lite (Reasoning)	$0.0018	16.3s	100%	100	100	100	100	100	100	100	100%
56	DeepSeek V3.2	$0.0004	43.3s	100%	100	100	100	100	100	100	100	100%
98	Z.AI GLM 4.7 Flash	$0.0016	1.4m	100%	100	100	100	100	100	100	100	100%
32	GPT-4o, Aug. 6th (temp=0)	$0.0065	2.4s	100%	100	100	100	100	100	100	100	100%
28	DeepSeek V4 Pro	$0.0014	18.8s	100%	100	100	100	100	100	100	100	100%
5	Inception Mercury 2	$0.0012	1.7s	100%	100	100	100	100	100	100	100	100%
58	Nemotron 3 Super	$0.0000	50.2s	100%	100	100	100	100	100	100	100	100%
25	Mistral Large 2	$0.0042	7.2s	100%	100	100	100	100	100	100	100	100%
10	GPT-4.1 Mini	$0.0010	6.3s	100%	100	100	100	100	100	100	100	100%
33	GPT-4o, Aug. 6th (temp=1)	$0.0065	2.7s	100%	100	100	100	100	100	100	100	100%
14	Grok 4.20	$0.0019	4.4s	100%	100	100	100	100	100	100	100	100%
36	Hermes 3 405B	$0.0012	24.6s	100%	100	100	100	100	100	100	100	100%
29	Z.AI GLM 4.5 Air	$0.0011	19.8s	100%	100	100	100	100	100	100	100	100%
7	Gemini 2.5 Flash	$0.0014	2.0s	100%	100	100	100	100	100	100	100	100%
59	GPT-5 Nano	$0.0018	44.6s	100%	100	100	100	100	100	100	100	100%
62	DeepSeek V3 (2025-03-24)	$0.0006	53.4s	100%	100	100	100	100	100	100	100	100%
1	Gemini 2.5 Flash Lite	$0.0003	1.5s	100%	100	100	100	100	100	100	100	100%
23	Qwen3 235B A22B Instruct 2507	$0.0004	18.2s	100%	100	100	100	100	100	100	100	100%
11	GPT-4o Mini (temp=1)	$0.0004	9.5s	100%	100	100	100	100	100	100	100	100%
6	Mistral Small 3.2 24B	$0.0002	6.2s	100%	100	100	100	100	100	100	100	100%
13	GPT-4o Mini (temp=0)	$0.0004	9.7s	100%	100	100	100	100	100	100	100	100%
8	Mistral Medium 3.1	$0.0012	5.1s	100%	100	100	100	100	100	100	100	100%
15	Qwen 2.5 72B	$0.0003	10.4s	100%	100	100	100	100	100	100	100	100%
44	WizardLM 2 8x22b	$0.0007	32.7s	100%	100	100	100	100	100	100	100	100%
60	Mistral Small 4 (Reasoning)	$0.0030	33.8s	98%	100	100	100	100	100	100	97	100%
31	Gemma 3 27B	$0.0002	17.0s	98%	100	100	100	100	100	100	97	100%
22	Mistral Small 4	$0.0004	3.1s	96%	100	100	100	100	100	100	94	99%
101	GPT-5.5	$0.018	4.6s	92%	100	100	100	100	100	100	89	98%
48	DeepSeek V4 Flash	$0.0002	9.5s	92%	100	100	100	100	100	100	89	98%
54	Grok 4.3	$0.0020	4.5s	92%	100	100	100	100	100	100	89	98%
45	Gemma 3 12B	$0.0001	7.4s	92%	100	100	100	100	100	100	89	98%
80	DeepSeek V3.1	$0.0007	33.3s	90%	100	100	100	100	100	100	86	98%
81	Qwen 3 32B	$0.0008	39.9s	92%	100	100	100	100	100	97	89	98%
42	Gemma 3 4B	$0.0001	5.5s	94%	100	100	100	100	97	94	92	98%
91	Z.AI GLM 4.5	$0.0038	28.9s	88%	100	100	100	100	100	100	83	98%
66	Cydonia 24B V4.1	$0.0005	12.3s	90%	100	100	100	100	94	89	89	96%
123	Aion 2.0	$0.0052	1.2m	81%	100	100	100	100	100	100	72	96%
78	ByteDance Seed 1.6 Flash	$0.0007	12.6s	87%	100	100	100	100	100	89	83	96%
116	GPT-5.4 Mini (Reasoning)	$0.012	15.2s	79%	100	100	100	100	100	100	69	96%
102	Llama 3.1 70B	$0.0005	39.8s	86%	100	100	100	100	100	86	83	96%
75	GPT-5.4 Mini (Reasoning, Low)	$0.0029	3.4s	89%	100	100	100	100	89	89	89	95%
67	GPT-5.4 Nano (Reasoning)	$0.0011	4.2s	89%	100	100	100	100	89	89	89	95%
83	Writer: Palmyra X5	$0.0035	9.5s	89%	100	100	100	100	89	89	89	95%
128	Gemini 3.5 Flash (Reasoning)	$0.026	10.8s	77%	100	100	100	100	100	100	67	95%
117	Qwen 3.6 Flash	$0.0087	26.3s	77%	100	100	100	100	100	100	67	95%
71	Ministral 8B	$0.0001	2.9s	88%	97	97	97	97	94	92	83	94%
113	GPT-5.4 (Reasoning, Low)	$0.0093	5.4s	79%	100	100	100	89	89	89	89	94%
112	GPT-5.4	$0.0090	6.1s	79%	100	100	100	89	89	89	89	94%
115	DeepSeek V3 (2024-12-26)	$0.0007	16.0s	69%	100	100	100	100	100	100	56	94%
76	Ministral 3 8B	$0.0002	3.0s	87%	97	97	97	94	92	92	86	94%
142	ByteDance Seed 2.0 Mini	$0.0026	3.0m	75%	100	100	100	100	100	72	72	92%
86	Ministral 3 14B	$0.0002	3.7s	86%	97	97	94	94	89	86	86	92%
138	Hermes 3 70B	$0.0010	1.3m	55%	100	100	100	100	100	100	36	91%
140	Aion 3.0	$0.014	39.7s	53%	100	100	100	100	100	100	33	90%
134	Nemotron 3 Nano	$0.0014	1.4m	71%	100	100	100	100	81	69	67	88%
109	GPT-5.4 Mini	$0.0027	2.7s	82%	89	89	89	89	89	89	78	87%
144	Aion 3.0 Mini	$0.0049	1.5m	50%	100	100	100	100	100	61	33	85%
119	Mistral NeMO	$0.0002	3.3s	72%	92	92	92	92	83	81	61	85%
141	DeepSeek V4 Flash (Reasoning)	$0.0008	34.8s	47%	100	100	100	72	69	69	56	81%
133	GPT-5.4 Nano (Reasoning, Low)	$0.0008	3.6s	58%	100	89	89	78	67	67	67	79%
129	GPT-5.4 Nano	$0.0007	3.4s	63%	89	89	89	78	78	67	67	79%
137	Cohere Command R+ (Aug. 2024)	$0.0066	10.9s	64%	91	86	83	81	67	66	65	77%
139	GPT-4.1 Nano	$0.0003	3.5s	56%	89	78	78	67	67	67	67	73%
146	Arcee AI: Trinity Mini	$0.0017	1.0m	39%	100	75	67	67	64	39	33	63%
143	Ministral 3 3B	$0.0001	1.8s	51%	75	72	64	61	61	53	50	62%
145	Ministral 3B	$0.0000	1.7s	53%	64	64	64	61	61	50	47	59%
97.20%