Avoid said/asked/replied/answered

Text Replacement

Tests deterministic text transformations: renaming characters/locations, expanding contractions, tense rewriting, POV shifts, gender swaps, combined transformations, and word avoidance. Scored by checking each expected change independently.

Text Editing

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
GPT-5.6 Sol (Reasoning)	100%
Claude Opus 4.6 (Reasoning)	100%
Qwen3.7 Max	100%
Grok 4.5 (Reasoning, High)	100%
Gemini 3.1 Pro (Preview)	100%
GPT-5.4 (Reasoning)	100%
Z.AI GLM 5.1	100%
Qwen3.6 Max Preview	100%
GPT-5.5 (Reasoning)	100%
Claude Sonnet 4.6 (Reasoning)	100%
Z.AI GLM 5.2 (Reasoning, High)	100%
Gemini 3.5 Flash (Reasoning)	100%
Z.AI GLM 5 Turbo	100%
MoonshotAI: Kimi K2.6	100%
Claude Opus 4.7 (Reasoning)	100%
GPT-5.5 (Reasoning, Low)	100%
GPT-5.6 Terra (Reasoning)	100%
Claude Opus 4.8 (Reasoning)	100%
Claude Opus 4.6	100%
Claude Opus 4.8 (Reasoning, Low)	100%

	Score	Cost	Time
Gemini 2.5 Flash Lite	100%	$0.0003	1.6s
Mistral Small 4	100%	$0.0004	2.7s
Mistral Small 3.2 24B	100%	$0.0002	4.8s
DeepSeek V4 Flash	95%	$0.0002	8.4s
Inception Mercury 2	100%	$0.0008	1.1s
Gemma 3 12B	100%	$0.0001	8.8s
Gemma 4 26B	100%	$0.0002	24.5s
Gemini 3.1 Flash Lite (Preview)	100%	$0.0009	1.7s
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0009	1.9s
Gemini 3.1 Flash Lite	100%	$0.0009	2.9s
Gemini 2.5 Flash Lite (Reasoning)	100%	$0.0006	4.9s
GPT-4o Mini (temp=1)	100%	$0.0004	8.5s
GPT-4o Mini (temp=0)	100%	$0.0004	9.0s
Qwen 2.5 72B	98%	$0.0003	9.8s
Gemma 3 27B	100%	$0.0002	14.1s
GPT-4.1 Mini	100%	$0.0010	6.2s
Gemini 2.5 Flash	100%	$0.0014	2.1s
Mistral Medium 3.1	100%	$0.0012	4.7s
Hermes 3 70B	100%	$0.0003	14.3s
Mistral Large 3	100%	$0.0010	7.2s

	Score	Cost	Speed	Stability
Gemini 2.5 Flash Lite	100%	$0.0003	1.6s	100%
Inception Mercury 2	100%	$0.0008	1.1s	100%
Mistral Small 4	100%	$0.0004	2.7s	100%
Gemini 3.1 Flash Lite (Preview)	100%	$0.0009	1.7s	100%
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0009	1.9s	100%
Mistral Small 3.2 24B	100%	$0.0002	4.8s	100%
Gemini 3.1 Flash Lite	100%	$0.0009	2.9s	100%
Gemini 2.5 Flash Lite (Reasoning)	100%	$0.0006	4.9s	100%
Gemini 2.5 Flash	100%	$0.0014	2.1s	100%
Mistral Medium 3.1	100%	$0.0012	4.7s	100%
Gemma 3 12B	100%	$0.0001	8.8s	100%
GPT-4.1 Mini	100%	$0.0010	6.2s	100%
GPT-4o Mini (temp=1)	100%	$0.0004	8.5s	100%
Gemini 3 Flash (Preview)	100%	$0.0018	3.8s	100%
Grok 4.20	100%	$0.0018	4.0s	100%
GPT-4o Mini (temp=0)	100%	$0.0004	9.0s	100%
Mistral Large 3	100%	$0.0010	7.2s	100%
GPT-5.4 Mini	100%	$0.0027	1.8s	100%
Qwen 3.5 Plus (2026-02-15)	100%	$0.0015	7.2s	100%
Claude Haiku 4.5	100%	$0.0033	2.7s	100%

Median	Evaluator	Top 3	Flop 3
100.0%	Forbidden words eliminated	100Qwen3.6 Max Preview 100Claude Sonnet 4.6 100Qwen 3.5 Flash	5Ministral 3 3B 10Ministral 3B 33GPT-5.4 Nano
100.0%	Key facts and content preserved	100GPT-5.5 (Reasoning) 100Claude Sonnet 4.6 100Z.AI GLM 5 Turbo	14Arcee AI: Trinity Mini 36Cohere Command R+ (Aug. 2024) 64Ministral 8B
100.0%	Structural similarity to original	100Gemini 2.5 Flash (Reasoning) 100GPT-4o, Aug. 6th (temp=0) 100Qwen 3.5 35B	67Arcee AI: Trinity Mini 95Ministral 3B 95ByteDance Seed 2.0 Mini

Text Replacement

Avoid said/asked/replied/answered

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	# 6	# 7	Total
106	GPT-5.6 Sol (Reasoning)	$0.019	12.8s	100%	100	100	100	100	100	100	100	100%
102	Claude Opus 4.6 (Reasoning)	$0.019	6.8s	100%	100	100	100	100	100	100	100	100%
127	Qwen3.7 Max	$0.024	44.6s	100%	100	100	100	100	100	100	100	100%
98	Grok 4.5 (Reasoning, High)	$0.014	24.2s	100%	100	100	100	100	100	100	100	100%
121	Gemini 3.1 Pro (Preview)	$0.023	22.6s	100%	100	100	100	100	100	100	100	100%
68	GPT-5.4 (Reasoning)	$0.010	8.3s	100%	100	100	100	100	100	100	100	100%
79	Z.AI GLM 5.1	$0.0050	38.4s	100%	100	100	100	100	100	100	100	100%
135	Qwen3.6 Max Preview	$0.028	1.6m	100%	100	100	100	100	100	100	100	100%
103	GPT-5.5 (Reasoning)	$0.020	6.6s	100%	100	100	100	100	100	100	100	100%
93	Claude Sonnet 4.6 (Reasoning)	$0.017	11.4s	100%	100	100	100	100	100	100	100	100%
33	Z.AI GLM 5.2 (Reasoning, High)	$0.0031	9.6s	100%	100	100	100	100	100	100	100	100%
89	Gemini 3.5 Flash (Reasoning)	$0.017	7.2s	100%	100	100	100	100	100	100	100	100%
44	Z.AI GLM 5 Turbo	$0.0048	10.5s	100%	100	100	100	100	100	100	100	100%
124	MoonshotAI: Kimi K2.6	$0.012	1.2m	100%	100	100	100	100	100	100	100	100%
112	Claude Opus 4.7 (Reasoning)	$0.023	3.9s	100%	100	100	100	100	100	100	100	100%
94	GPT-5.5 (Reasoning, Low)	$0.018	5.4s	100%	100	100	100	100	100	100	100	100%
56	GPT-5.6 Terra (Reasoning)	$0.0092	5.7s	100%	100	100	100	100	100	100	100	100%
115	Claude Opus 4.8 (Reasoning)	$0.023	7.6s	100%	100	100	100	100	100	100	100	100%
87	Claude Opus 4.6	$0.017	5.3s	100%	100	100	100	100	100	100	100	100%
114	Claude Opus 4.8 (Reasoning, Low)	$0.023	6.8s	100%	100	100	100	100	100	100	100	100%
105	GPT-5	$0.016	23.2s	100%	100	100	100	100	100	100	100	100%
51	GPT-5 Mini	$0.0036	22.3s	100%	100	100	100	100	100	100	100	100%
136	Qwen 3.5 397B A17B	$0.0053	3.0m	100%	100	100	100	100	100	100	100	100%
101	Grok 4.3 (Reasoning)	$0.0090	43.7s	100%	100	100	100	100	100	100	100	100%
109	Grok 4.5 (Reasoning, Low)	$0.0091	51.9s	100%	100	100	100	100	100	100	100	100%
55	GPT-5.4 (Reasoning, Low)	$0.0092	5.7s	100%	100	100	100	100	100	100	100	100%
76	Grok 4.20 (Reasoning)	$0.0076	27.4s	100%	100	100	100	100	100	100	100	100%
108	MoonshotAI: Kimi K2.5	$0.0066	59.8s	100%	100	100	100	100	100	100	100	100%
92	GPT-5.6 Sol	$0.018	5.4s	100%	100	100	100	100	100	100	100	100%
59	Claude Sonnet 4.6	$0.0100	4.3s	100%	100	100	100	100	100	100	100	100%
28	GPT-5.6 Luna (Reasoning)	$0.0040	3.6s	100%	100	100	100	100	100	100	100	100%
49	MiniMax M3	$0.0015	28.9s	100%	100	100	100	100	100	100	100	100%
70	Claude Sonnet 5 (Reasoning)	$0.011	9.4s	100%	100	100	100	100	100	100	100	100%
72	Claude Sonnet 5 (Reasoning, Low)	$0.011	9.7s	100%	100	100	100	100	100	100	100	100%
116	Qwen 3.5 27B	$0.011	50.2s	100%	100	100	100	100	100	100	100	100%
83	Gemini 3 Flash (Preview, Reasoning)	$0.012	20.5s	100%	100	100	100	100	100	100	100	100%
111	Claude Opus 4.7	$0.023	4.2s	100%	100	100	100	100	100	100	100	100%
118	Qwen 3.5 Plus (2026-04-20)	$0.0088	1.0m	100%	100	100	100	100	100	100	100	100%
122	Gemma 4 31B (Reasoning)	$0.0007	1.7m	100%	100	100	100	100	100	100	100	100%
86	Claude Opus 4.5	$0.017	5.3s	100%	100	100	100	100	100	100	100	100%
46	Z.AI GLM 5	$0.0031	19.1s	100%	100	100	100	100	100	100	100	100%
66	ByteDance Seed 1.6	$0.0030	33.0s	100%	100	100	100	100	100	100	100	100%
48	GPT-5.2	$0.0079	5.4s	100%	100	100	100	100	100	100	100	100%
90	GPT-5.5	$0.018	4.9s	100%	100	100	100	100	100	100	100	100%
53	Qwen 3.6 Flash	$0.0053	17.5s	100%	100	100	100	100	100	100	100	100%
138	DeepSeek V4 Pro (Reasoning)	$0.010	2.9m	100%	100	100	100	100	100	100	100	100%
131	Gemma 4 26B (Reasoning)	$0.0010	2.7m	100%	100	100	100	100	100	100	100	100%
62	Aion 3.0	$0.0067	17.9s	100%	100	100	100	100	100	100	100	100%
95	o4 Mini High	$0.014	22.4s	100%	100	100	100	100	100	100	100	100%
123	Gemini 2.5 Pro	$0.025	18.9s	100%	100	100	100	100	100	100	100	100%
104	Qwen 3.6 27B	$0.0099	43.6s	100%	100	100	100	100	100	100	100	100%
50	GPT-5.6 Terra	$0.0088	3.5s	100%	100	100	100	100	100	100	100	100%
25	DeepSeek V4 Flash (Reasoning)	$0.0003	16.2s	100%	100	100	100	100	100	100	100	100%
125	Z.AI GLM 4.7	$0.0060	1.6m	100%	100	100	100	100	100	100	100	100%
58	Qwen 3.6 35B	$0.0042	24.8s	100%	100	100	100	100	100	100	100	100%
97	Z.AI GLM 4.6	$0.0046	56.4s	100%	100	100	100	100	100	100	100	100%
61	Claude Sonnet 4	$0.0099	5.4s	100%	100	100	100	100	100	100	100	100%
60	Claude Sonnet 4.5	$0.0099	4.5s	100%	100	100	100	100	100	100	100	100%
64	Claude Sonnet 5	$0.0092	9.4s	100%	100	100	100	100	100	100	100	100%
133	Claude Opus 4	$0.050	7.7s	100%	100	100	100	100	100	100	100	100%
110	Qwen 3.5 35B	$0.013	40.2s	100%	100	100	100	100	100	100	100	100%
78	Aion 2.0	$0.0034	43.4s	100%	100	100	100	100	100	100	100	100%
75	o4 Mini	$0.0097	18.8s	100%	100	100	100	100	100	100	100	100%
19	Qwen 3.5 Plus (2026-02-15)	$0.0015	7.2s	100%	100	100	100	100	100	100	100	100%
57	Xiaomi MIMO v2.5 Pro	$0.0047	22.2s	100%	100	100	100	100	100	100	100	100%
5	Gemini 3.1 Flash Lite (Reasoning)	$0.0009	1.9s	100%	100	100	100	100	100	100	100	100%
35	Gemini 3.5 Flash (Reasoning, Minimal)	$0.0053	2.6s	100%	100	100	100	100	100	100	100	100%
73	Qwen 3.5 Flash	$0.0025	42.3s	100%	100	100	100	100	100	100	100	100%
14	Gemini 3 Flash (Preview)	$0.0018	3.8s	100%	100	100	100	100	100	100	100	100%
4	Gemini 3.1 Flash Lite (Preview)	$0.0009	1.7s	100%	100	100	100	100	100	100	100	100%
30	Gemma 4 31B	$0.0003	17.9s	100%	100	100	100	100	100	100	100	100%
7	Gemini 3.1 Flash Lite	$0.0009	2.9s	100%	100	100	100	100	100	100	100	100%
23	GPT-5.6 Luna	$0.0035	2.7s	100%	100	100	100	100	100	100	100	100%
32	Z.AI GLM 4.5	$0.0016	13.5s	100%	100	100	100	100	100	100	100	100%
39	Gemma 4 26B	$0.0002	24.5s	100%	100	100	100	100	100	100	100	100%
17	Mistral Large 3	$0.0010	7.2s	100%	100	100	100	100	100	100	100	100%
88	ByteDance Seed 2.0 Lite	$0.0044	49.8s	100%	100	100	100	100	100	100	100	100%
29	Gemini 2.5 Flash (Reasoning)	$0.0036	5.6s	100%	100	100	100	100	100	100	100	100%
26	DeepSeek-V2 Chat	$0.0007	15.2s	100%	100	100	100	100	100	100	100	100%
126	Qwen 3.5 9B	$0.0014	2.0m	100%	100	100	100	100	100	100	100	100%
38	Xiaomi MIMO v2.5	$0.0030	12.8s	100%	100	100	100	100	100	100	100	100%
84	Aion 3.0 Mini	$0.0032	52.4s	100%	100	100	100	100	100	100	100	100%
20	Claude Haiku 4.5	$0.0033	2.7s	100%	100	100	100	100	100	100	100	100%
8	Gemini 2.5 Flash Lite (Reasoning)	$0.0006	4.9s	100%	100	100	100	100	100	100	100	100%
27	DeepSeek V3 (2024-12-26)	$0.0008	15.1s	100%	100	100	100	100	100	100	100	100%
71	DeepSeek V3.2	$0.0004	46.5s	100%	100	100	100	100	100	100	100	100%
41	GPT-4o, Aug. 6th (temp=0)	$0.0063	2.6s	100%	100	100	100	100	100	100	100	100%
31	DeepSeek V4 Pro	$0.0009	15.7s	100%	100	100	100	100	100	100	100	100%
2	Inception Mercury 2	$0.0008	1.1s	100%	100	100	100	100	100	100	100	100%
37	Nemotron 3 Super	$0.0000	23.2s	100%	100	100	100	100	100	100	100	100%
34	Mistral Large 2	$0.0041	6.9s	100%	100	100	100	100	100	100	100	100%
12	GPT-4.1 Mini	$0.0010	6.2s	100%	100	100	100	100	100	100	100	100%
40	GPT-4o, Aug. 6th (temp=1)	$0.0064	2.6s	100%	100	100	100	100	100	100	100	100%
15	Grok 4.20	$0.0018	4.0s	100%	100	100	100	100	100	100	100	100%
42	Hermes 3 405B	$0.0011	21.8s	100%	100	100	100	100	100	100	100	100%
43	Z.AI GLM 4.5 Air	$0.0012	23.4s	100%	100	100	100	100	100	100	100	100%
9	Gemini 2.5 Flash	$0.0014	2.1s	100%	100	100	100	100	100	100	100	100%
18	GPT-5.4 Mini	$0.0027	1.8s	100%	100	100	100	100	100	100	100	100%
77	GPT-5 Nano	$0.0020	48.2s	100%	100	100	100	100	100	100	100	100%
45	DeepSeek V3 (2025-03-24)	$0.0005	28.0s	100%	100	100	100	100	100	100	100	100%
1	Gemini 2.5 Flash Lite	$0.0003	1.6s	100%	100	100	100	100	100	100	100	100%
22	Mistral Small 4 (Reasoning)	$0.0012	10.9s	100%	100	100	100	100	100	100	100	100%
13	GPT-4o Mini (temp=1)	$0.0004	8.5s	100%	100	100	100	100	100	100	100	100%
36	Llama 3.1 70B	$0.0004	21.0s	100%	100	100	100	100	100	100	100	100%
6	Mistral Small 3.2 24B	$0.0002	4.8s	100%	100	100	100	100	100	100	100	100%
16	GPT-4o Mini (temp=0)	$0.0004	9.0s	100%	100	100	100	100	100	100	100	100%
10	Mistral Medium 3.1	$0.0012	4.7s	100%	100	100	100	100	100	100	100	100%
11	Gemma 3 12B	$0.0001	8.8s	100%	100	100	100	100	100	100	100	100%
21	Gemma 3 27B	$0.0002	14.1s	100%	100	100	100	100	100	100	100	100%
3	Mistral Small 4	$0.0004	2.7s	100%	100	100	100	100	100	100	100	100%
47	Nemotron 3 Nano	$0.0004	30.7s	100%	100	100	100	100	100	100	100	100%
65	WizardLM 2 8x22b	$0.0007	40.9s	100%	100	100	100	100	100	100	100	100%
24	Hermes 3 70B	$0.0003	14.3s	100%	100	100	100	100	100	100	100	100%
52	Grok 4.3	$0.0020	5.1s	94%	100	100	100	100	100	100	92	99%
85	GPT-5.1	$0.0074	6.1s	92%	100	100	100	100	100	100	89	98%
69	GPT-5.4 Mini (Reasoning)	$0.0032	3.5s	92%	100	100	100	100	100	100	89	98%
63	Qwen 2.5 72B	$0.0003	9.8s	92%	100	100	100	100	100	100	89	98%
74	GPT-4.1	$0.0052	4.4s	93%	100	100	100	97	97	97	94	98%
54	Qwen3 235B A22B Instruct 2507	$0.0002	11.2s	95%	100	100	97	97	97	97	97	98%
120	MiniMax M2.5	$0.0016	1.0m	90%	100	100	100	100	100	100	86	98%
128	Z.AI GLM 4.7 Flash	$0.0013	1.5m	90%	100	100	100	100	100	100	86	98%
67	Writer: Palmyra X5	$0.0034	7.1s	95%	100	97	97	97	97	97	97	98%
129	Qwen 3.5 122B	$0.018	52.0s	88%	100	100	100	100	100	100	83	98%
113	DeepSeek V3.1	$0.0006	38.4s	88%	100	100	100	100	100	100	83	98%
99	MiniMax M2.7	$0.0019	21.8s	90%	100	100	100	100	100	89	89	97%
107	GPT-5.4	$0.0088	5.9s	90%	100	100	100	100	100	89	89	97%
80	GPT-5.4 Mini (Reasoning, Low)	$0.0028	3.2s	90%	100	100	100	100	100	89	89	97%
81	GPT-5.4 Nano (Reasoning)	$0.0010	4.4s	89%	100	100	100	100	97	89	86	96%
139	ByteDance Seed 2.0 Mini	$0.0021	2.2m	81%	100	100	100	100	100	100	72	96%
117	ByteDance Seed 1.6 Flash	$0.0006	10.7s	81%	100	100	100	100	100	100	72	96%
100	GPT-OSS 120B	$0.0004	18.7s	89%	100	100	100	100	89	89	89	95%
91	Cydonia 24B V4.1	$0.0004	12.4s	89%	100	100	100	100	89	89	89	95%
119	DeepSeek V4 Flash	$0.0002	8.4s	77%	100	100	100	100	100	100	67	95%
96	Gemma 3 4B	$0.0001	6.4s	87%	100	97	97	94	94	92	86	94%
82	Mistral NeMO	$0.0002	2.8s	90%	97	94	94	94	94	92	89	94%
132	Qwen 3 32B	$0.0011	33.9s	72%	100	100	92	92	83	75	69	87%
134	GPT-4.1 Nano	$0.0003	4.0s	63%	97	94	92	83	81	81	58	84%
130	Ministral 3 14B	$0.0002	4.1s	73%	86	86	86	83	83	83	67	82%
140	GPT-5.4 Nano (Reasoning, Low)	$0.0007	3.1s	56%	100	100	78	78	67	67	67	79%
137	GPT-5.4 Nano	$0.0007	2.9s	65%	89	89	78	78	78	67	67	78%
142	Cohere Command R+ (Aug. 2024)	$0.0066	56.0s	71%	81	81	78	78	78	78	67	77%
143	Ministral 8B	$0.0001	3.5s	44%	92	92	86	64	61	56	56	72%
141	Ministral 3 8B	$0.0002	3.0s	59%	81	81	81	75	64	58	53	70%
144	Ministral 3 3B	$0.0001	1.9s	54%	69	64	61	58	58	58	58	61%
145	Ministral 3B	$0.0000	1.8s	49%	69	69	61	58	56	53	44	59%
146	Arcee AI: Trinity Mini	$0.0002	7.5s	52%	64	61	61	58	58	50	47	57%
97.52%