Romance: separated couple reunites

Bad Writing Habits

Detects common prose quality anti-patterns in AI-generated creative writing, including passive voice, past progressive overuse, weak dialogue tags, filter words, purple prose, cliches, AI-ism words/adverbs/names, and more.

Creative Writing Hallucination

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
GPT-5.4 (Reasoning, Low)	90%
GPT-5.4 Mini	90%
GPT-5.5	90%
GPT-5.5 (Reasoning, Low)	89%
GPT-5.4 (Reasoning)	89%
GPT-5.4	89%
GPT-5.5 (Reasoning)	88%
GPT-5.4 Mini (Reasoning)	87%
GPT-5.1	87%
Grok 4.5 (Reasoning, High)	86%
GPT-5.4 Mini (Reasoning, Low)	86%
Grok 4.20 (Reasoning)	86%
Claude Opus 4	86%
Grok 4.20	86%
DeepSeek V4 Flash	85%
Qwen 3.6 35B	85%
Qwen 3.6 Flash	85%
DeepSeek V4 Pro (Reasoning)	85%
Aion 3.0 Mini	85%
Qwen 3.5 397B A17B	85%

	Score	Cost	Time
GPT-5.4 Mini	90%	$0.014	15.5s
Mistral Large 3	84%	$0.0026	28.0s
GPT-5.4 (Reasoning, Low)	90%	$0.052	1.4m
GPT-5.4 Mini (Reasoning, Low)	86%	$0.015	16.6s
GPT-5.4 Mini (Reasoning)	87%	$0.021	24.2s
Grok 4.3	84%	$0.0066	41.3s
Qwen 3.6 35B	85%	$0.0063	51.6s
Grok 4.20	86%	$0.0084	54.9s
DeepSeek V4 Flash (Reasoning)	83%	$0.0007	34.4s
Qwen 3.5 122B	84%	$0.016	47.3s
Aion 3.0 Mini	85%	$0.0034	58.6s
DeepSeek V4 Pro (Reasoning)	85%	$0.0028	1.4m
GPT-5.4	89%	$0.051	1.4m
DeepSeek V4 Flash	85%	$0.0006	29.0s
Ministral 3 14B	84%	$0.0004	9.5s
Qwen 3.6 Flash	85%	$0.011	40.6s
Mistral Small 4	84%	$0.0011	16.9s
Qwen 3.5 Flash	84%	$0.0026	45.9s
Qwen 3.5 35B	84%	$0.016	1.0m
Qwen 3 32B	84%	$0.0015	1.1m

	Score	Consistency	Stability
GPT-5.4 (Reasoning, Low)	90%	99%	90%
GPT-5.4 Mini	90%	98%	88%
GPT-5.5	90%	98%	88%
GPT-5.5 (Reasoning)	88%	98%	87%
GPT-5.4 (Reasoning)	89%	97%	87%
GPT-5.4 Mini (Reasoning)	87%	98%	85%
GPT-5.4 Mini (Reasoning, Low)	86%	98%	84%
GPT-5.5 (Reasoning, Low)	89%	94%	84%
GPT-5.4	89%	94%	83%
GPT-5.1	87%	96%	83%
Grok 4.5 (Reasoning, High)	86%	96%	83%
Grok 4.20 (Reasoning)	86%	95%	83%
Claude Opus 4	86%	96%	82%
Qwen 3.5 397B A17B	85%	98%	82%
o4 Mini High	84%	98%	82%
Qwen3.7 Max	83%	98%	82%
Qwen 3.5 Flash	84%	97%	82%
Aion 3.0 Mini	85%	96%	82%
Qwen 3.6 35B	85%	95%	82%
Aion 3.0	84%	96%	81%

	Score	Cost	Speed	Stability
GPT-5.4 Mini	90%	$0.014	15.5s	88%
GPT-5.4 (Reasoning, Low)	90%	$0.052	1.4m	90%
GPT-5.4 Mini (Reasoning, Low)	86%	$0.015	16.6s	84%
GPT-5.4 Mini (Reasoning)	87%	$0.021	24.2s	85%
DeepSeek V4 Flash	85%	$0.0006	29.0s	80%
Qwen 3.6 35B	85%	$0.0063	51.6s	82%
Aion 3.0 Mini	85%	$0.0034	58.6s	82%
Qwen 3.5 Flash	84%	$0.0026	45.9s	82%
Mistral Small 4	84%	$0.0011	16.9s	80%
Ministral 3 14B	84%	$0.0004	9.5s	79%
Grok 4.20	86%	$0.0084	54.9s	80%
ByteDance Seed 1.6 Flash	84%	$0.0012	28.0s	79%
DeepSeek V4 Pro (Reasoning)	85%	$0.0028	1.4m	81%
GPT-5.4	89%	$0.051	1.4m	83%
o4 Mini High	84%	$0.021	39.0s	82%
DeepSeek V3 (2025-03-24)	84%	$0.0013	1.1m	81%
Mistral Large 2	83%	$0.0097	32.4s	80%
Grok 4.5 (Reasoning, High)	86%	$0.026	1.8m	83%
Aion 3.0	84%	$0.019	58.7s	81%
Grok 4.20 (Reasoning)	86%	$0.020	2.0m	83%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	Total
2	GPT-5.4 (Reasoning, Low)	$0.052	1.4m	90%	91	90	90	90	89	90%
1	GPT-5.4 Mini	$0.014	15.5s	88%	91	90	90	89	88	90%
74	GPT-5.5	$0.156	2.0m	88%	91	90	90	89	88	90%
98	GPT-5.5 (Reasoning, Low)	$0.155	2.0m	84%	94	90	89	87	85	89%
36	GPT-5.4 (Reasoning)	$0.080	2.4m	87%	91	90	89	88	86	89%
14	GPT-5.4	$0.051	1.4m	83%	93	91	89	87	83	89%
83	GPT-5.5 (Reasoning)	$0.150	1.9m	87%	90	89	89	88	86	88%
4	GPT-5.4 Mini (Reasoning)	$0.021	24.2s	85%	88	88	87	87	85	87%
29	GPT-5.1	$0.047	1.5m	83%	90	87	87	85	83	87%
18	Grok 4.5 (Reasoning, High)	$0.026	1.8m	83%	90	87	87	86	83	86%
3	GPT-5.4 Mini (Reasoning, Low)	$0.015	16.6s	84%	88	87	86	86	84	86%
20	Grok 4.20 (Reasoning)	$0.020	2.0m	83%	90	87	87	85	83	86%
117	Claude Opus 4	$0.175	1.2m	82%	89	87	86	86	82	86%
11	Grok 4.20	$0.0084	54.9s	80%	89	88	86	86	79	86%
5	DeepSeek V4 Flash	$0.0006	29.0s	80%	89	87	84	84	83	85%
6	Qwen 3.6 35B	$0.0063	51.6s	82%	88	87	86	85	81	85%
23	Qwen 3.6 Flash	$0.011	40.6s	77%	90	90	85	83	78	85%
13	DeepSeek V4 Pro (Reasoning)	$0.0028	1.4m	81%	89	88	86	82	81	85%
7	Aion 3.0 Mini	$0.0034	58.6s	82%	88	87	85	84	82	85%
77	Qwen 3.5 397B A17B	$0.0068	5.4m	82%	87	85	84	84	84	85%
46	Grok 4.3 (Reasoning)	$0.024	2.2m	80%	89	86	84	84	82	85%
73	GPT-5	$0.058	1.8m	78%	89	87	83	82	81	85%
22	Mistral Small 4 (Reasoning)	$0.0019	29.4s	76%	90	88	83	83	79	85%
67	Claude Opus 4.6 (Reasoning)	$0.076	1.3m	80%	88	87	86	82	80	85%
26	Mistral Large 3	$0.0026	28.0s	75%	91	91	87	78	75	84%
30	Qwen 3.5 35B	$0.016	1.0m	79%	88	87	84	83	80	84%
38	Qwen 3.5 Plus (2026-04-20)	$0.016	1.7m	80%	88	84	84	84	81	84%
19	Aion 3.0	$0.019	58.7s	81%	88	85	85	82	82	84%
28	Z.AI GLM 5	$0.0073	59.0s	78%	90	83	83	83	82	84%
54	Qwen 3 32B	$0.0015	1.1m	71%	92	92	83	81	73	84%
21	Grok 4.3	$0.0066	41.3s	78%	87	87	86	85	76	84%
8	Qwen 3.5 Flash	$0.0026	45.9s	82%	86	85	84	83	82	84%
41	DeepSeek V4 Pro	$0.0040	1.9m	78%	89	85	83	82	81	84%
9	Mistral Small 4	$0.0011	16.9s	80%	88	84	84	83	82	84%
49	ByteDance Seed 2.0 Lite	$0.012	2.3m	79%	87	86	85	83	77	84%
42	Z.AI GLM 5 Turbo	$0.0085	41.1s	75%	92	85	83	80	79	84%
27	Qwen 3.5 122B	$0.016	47.3s	79%	88	86	86	81	78	84%
15	o4 Mini High	$0.021	39.0s	82%	85	84	84	83	83	84%
12	ByteDance Seed 1.6 Flash	$0.0012	28.0s	79%	88	84	83	82	81	84%
35	Grok 4.5 (Reasoning, Low)	$0.017	52.7s	79%	88	85	83	82	81	84%
10	Ministral 3 14B	$0.0004	9.5s	79%	88	85	83	81	81	84%
16	DeepSeek V3 (2025-03-24)	$0.0013	1.1m	81%	86	84	84	82	82	84%
88	Qwen3.7 Max	$0.069	2.6m	82%	85	84	84	82	82	83%
53	Claude Sonnet 4.5	$0.029	33.6s	75%	92	83	83	80	79	83%
17	Mistral Large 2	$0.0097	32.4s	80%	85	85	83	83	80	83%
99	Qwen3.6 Max Preview	$0.052	3.7m	81%	85	84	83	83	81	83%
40	Writer: Palmyra X5	$0.011	22.3s	76%	89	83	82	81	79	83%
31	Qwen3 235B A22B Instruct 2507	$0.0010	53.3s	78%	87	86	84	79	79	83%
93	Claude Opus 4.6	$0.071	1.1m	77%	89	86	85	78	76	83%
105	Gemini 3.1 Pro (Preview)	$0.110	1.5m	81%	85	84	83	82	80	83%
43	Qwen 3.5 9B	$0.0010	1.4m	77%	88	85	82	81	79	83%
24	o4 Mini	$0.012	22.7s	79%	87	83	83	82	79	83%
57	Claude Opus 4.8 (Reasoning, Low)	$0.060	39.2s	80%	86	85	85	79	78	83%
25	Xiaomi MIMO v2.5	$0.0053	31.9s	78%	87	83	82	81	81	83%
33	DeepSeek V4 Flash (Reasoning)	$0.0007	34.4s	77%	86	86	84	83	74	83%
39	Qwen 3.5 27B	$0.011	1.2m	80%	85	83	82	82	81	83%
60	Claude Opus 4.8 (Reasoning)	$0.059	39.4s	80%	85	84	83	81	79	82%
32	Mistral Medium 3.1	$0.0040	36.4s	79%	84	84	84	82	76	82%
84	Claude Opus 4.7 (Reasoning)	$0.061	27.2s	76%	85	85	82	82	76	82%
119	MoonshotAI: Kimi K2.5	$0.022	5.7m	79%	85	81	81	81	81	82%
69	Claude Sonnet 4	$0.028	40.0s	74%	89	83	81	79	77	82%
138	MoonshotAI: Kimi K2.6	$0.063	8.6m	77%	84	84	83	81	75	81%
37	Gemini 3.1 Flash Lite (Reasoning)	$0.0030	19.5s	77%	85	84	81	79	79	81%
80	Z.AI GLM 5.1	$0.017	2.2m	77%	85	85	83	79	76	81%
58	MiniMax M2.5	$0.0030	1.3m	75%	87	83	81	80	76	81%
34	GPT-5.4 Nano (Reasoning, Low)	$0.0070	24.9s	79%	83	82	81	80	80	81%
51	DeepSeek V3.2	$0.0011	1.3m	77%	84	83	81	81	76	81%
52	Ministral 8B	$0.0002	7.8s	72%	89	84	81	80	73	81%
89	WizardLM 2 8x22b	$0.0020	2.9m	75%	86	82	80	79	79	81%
91	GPT-5.2	$0.051	1.4m	78%	83	82	81	81	77	81%
44	Gemma 3 27B	$0.0005	47.9s	77%	84	82	80	80	78	81%
59	Z.AI GLM 5.2 (Reasoning, High)	$0.011	58.8s	76%	85	83	80	79	78	81%
47	GPT-5.4 Nano	$0.0074	33.9s	76%	85	81	80	79	79	81%
45	MiniMax M2.7	$0.0046	1.2m	79%	83	82	81	79	79	81%
64	MiniMax M3	$0.0042	2.3m	78%	83	81	81	79	79	81%
76	Z.AI GLM 4.6	$0.0058	58.1s	73%	87	83	79	78	76	81%
75	DeepSeek V3 (2024-12-26)	$0.0018	50.4s	72%	86	85	80	79	71	80%
48	Gemini 3.1 Flash Lite (Preview)	$0.0029	9.0s	75%	85	82	80	80	74	80%
55	GPT-4.1	$0.016	43.7s	77%	83	82	81	78	76	80%
90	Claude Opus 4.7	$0.058	27.2s	77%	82	82	79	79	78	80%
61	Xiaomi MIMO v2.5 Pro	$0.0087	57.3s	75%	84	82	80	78	76	80%
87	Gemini 2.5 Pro	$0.035	36.8s	74%	85	81	80	79	74	80%
56	Z.AI GLM 4.5	$0.0049	46.5s	76%	84	80	79	78	77	80%
66	Claude Sonnet 5	$0.022	30.7s	76%	82	81	80	80	74	80%
100	Claude Opus 4.5	$0.069	56.6s	78%	81	80	80	79	77	80%
135	ByteDance Seed 2.0 Mini	$0.0045	5.1m	63%	91	86	75	73	72	79%
72	Z.AI GLM 4.7	$0.0098	56.1s	76%	83	81	80	77	75	79%
124	Qwen 3.6 27B	$0.031	2.9m	71%	84	84	77	76	74	79%
63	Gemma 4 26B	$0.0008	57.7s	75%	83	80	80	79	74	79%
50	Ministral 3 8B	$0.0004	8.3s	75%	83	80	80	78	75	79%
71	GPT-5 Mini	$0.010	1.2m	77%	81	79	79	79	77	79%
92	Claude Sonnet 4.6 (Reasoning)	$0.031	42.1s	75%	83	80	79	77	75	79%
70	Aion 2.0	$0.0062	1.4m	77%	80	80	80	79	76	79%
62	Qwen 3.5 Plus (2026-02-15)	$0.0052	32.8s	75%	82	80	79	76	75	79%
78	Claude Sonnet 5 (Reasoning, Low)	$0.025	33.6s	76%	81	80	79	77	76	79%
86	Claude Haiku 4.5	$0.0098	19.9s	71%	86	80	78	77	72	79%
81	Gemini 3 Flash (Preview, Reasoning)	$0.013	31.8s	74%	82	80	79	76	75	78%
82	Claude Sonnet 5 (Reasoning)	$0.021	42.7s	76%	80	79	79	77	76	78%
113	Hermes 3 405B	$0.0021	45.8s	66%	87	85	76	75	68	78%
65	GPT-5.4 Nano (Reasoning)	$0.0077	28.5s	76%	80	79	78	77	76	78%
68	GPT-4o Mini (temp=1)	$0.0011	33.7s	75%	81	80	80	76	73	78%
107	Gemma 4 26B (Reasoning)	$0.0012	1.7m	72%	81	81	77	75	74	78%
104	Cohere Command R+ (Aug. 2024)	$0.015	52.9s	72%	84	79	79	73	72	77%
128	ByteDance Seed 1.6	$0.015	2.9m	69%	83	82	76	73	73	77%
79	Ministral 3 3B	$0.0003	6.4s	73%	81	78	76	76	74	77%
85	Ministral 3B	$0.0002	14.6s	72%	82	79	78	74	73	77%
103	Gemma 4 31B (Reasoning)	$0.0013	1.4m	72%	81	78	76	76	74	77%
102	Hermes 3 70B	$0.0006	1.2m	72%	82	79	78	75	71	77%
118	DeepSeek-V2 Chat	$0.0017	1.1m	67%	85	79	74	73	71	77%
94	Gemini 3.1 Flash Lite	$0.0027	11.8s	71%	81	79	76	75	71	77%
97	Gemini 3.5 Flash (Reasoning, Minimal)	$0.017	11.8s	73%	79	78	76	75	73	76%
111	DeepSeek V3.1	$0.0020	2.1m	74%	78	77	77	75	74	76%
109	Claude Sonnet 4.6	$0.024	32.3s	73%	78	77	76	75	72	76%
120	Gemma 4 31B	$0.0008	2.5m	72%	80	78	77	72	71	76%
108	Qwen 2.5 72B	$0.0006	31.5s	70%	81	76	74	74	73	75%
95	Gemini 2.5 Flash	$0.0047	10.0s	72%	78	77	76	75	71	75%
96	GPT-4o Mini (temp=0)	$0.0011	33.8s	73%	77	77	76	74	72	75%
122	GPT-4o, Aug. 6th (temp=1)	$0.016	29.4s	67%	80	80	74	72	69	75%
115	Z.AI GLM 4.7 Flash	$0.0016	59.9s	70%	79	78	73	73	72	75%
140	Gemini 3.5 Flash (Reasoning)	$0.193	1.4m	70%	79	78	74	72	72	75%
106	Mistral NeMO	$0.0003	7.4s	70%	79	77	74	73	72	75%
110	Gemini 3 Flash (Preview)	$0.0083	21.1s	71%	77	76	74	74	71	74%
101	Inception Mercury 2	$0.0025	6.5s	72%	76	76	76	72	70	74%
125	Cydonia 24B V4.1	$0.0014	55.4s	66%	83	73	72	72	71	74%
123	Z.AI GLM 4.5 Air	$0.0030	1.2m	68%	80	75	73	71	71	74%
116	Gemma 3 12B	$0.0003	37.0s	70%	76	75	75	74	67	74%
112	Gemini 2.5 Flash (Reasoning)	$0.012	22.7s	72%	75	74	73	73	72	74%
114	GPT-4.1 Nano	$0.0006	13.6s	69%	76	76	74	73	68	73%
121	GPT-4.1 Mini	$0.0021	15.6s	67%	78	76	73	70	67	73%
126	Gemini 2.5 Flash Lite (Reasoning)	$0.0030	39.4s	68%	76	74	73	70	66	72%
132	GPT-5 Nano	$0.0047	1.5m	64%	78	72	69	68	68	71%
133	Llama 3.1 70B	$0.0008	21.5s	60%	80	76	68	67	64	71%
131	GPT-OSS 120B	$0.0014	1.9m	67%	74	71	70	70	68	71%
127	Gemma 3 4B	$0.0002	19.7s	67%	74	74	72	67	66	70%
139	Mistral Small 3.2 24B	$0.0044	3.7m	63%	79	71	70	67	64	70%
134	GPT-4o, Aug. 6th (temp=0)	$0.015	15.4s	63%	74	72	71	69	60	69%
130	Gemini 2.5 Flash Lite	$0.0009	10.3s	65%	74	72	72	69	60	69%
136	Nemotron 3 Super	$0.0000	2.1m	64%	75	71	71	67	61	69%
129	Arcee AI: Trinity Mini	$0.0003	9.4s	67%	71	70	69	67	67	69%
137	Nemotron 3 Nano	$0.0009	1.3m	61%	72	70	66	64	64	67%
80.25%

Median	Evaluator	Top 3	Flop 3
100.0%	"Not X but Y" pattern overuse	100Llama 3.1 70B 100DeepSeek V4 Flash (Reasoning) 100Gemini 3 Flash (Preview, Reasoning)	21GPT-5 Nano 34Nemotron 3 Super 71Gemma 3 4B
40.6%	Adverb-first sentence starts	97GPT-5.4 Mini 94GPT-5.4 (Reasoning, Low) 94Grok 4.20	0GPT-4o, Aug. 6th (temp=0) 0ByteDance Seed 1.6 0GPT-OSS 120B
100.0%	Adverbs in dialogue tags	100Grok 4.5 (Reasoning, Low) 100GPT-5.1 100Claude Opus 4.8 (Reasoning)	34Llama 3.1 70B 41Hermes 3 70B 46Arcee AI: Trinity Mini
90.7%	AI-ism adverb frequency	100MoonshotAI: Kimi K2.6 100Gemini 3.1 Pro (Preview) 99GPT-5.5	54Cydonia 24B V4.1 58Mistral Small 3.2 24B 66GPT-4.1 Nano
100.0%	AI-ism character names	100Claude Opus 4.7 100Mistral Small 4 (Reasoning) 100Qwen 3.5 27B	88Claude Sonnet 4 92Claude Opus 4.5 92GPT-5.5 (Reasoning, Low)
100.0%	AI-ism location names	100Qwen 3.5 27B 100WizardLM 2 8x22b 100GPT-5.4 Mini (Reasoning, Low)	—
53.9%	AI-ism word frequency	89Claude Sonnet 5 (Reasoning) 89ByteDance Seed 2.0 Mini 87Claude Opus 4.7 (Reasoning)	0GPT-4o, Aug. 6th (temp=0) 0GPT-4o Mini (temp=1) 0GPT-4o Mini (temp=0)
96.7%	Cliché density	100GPT-5.5 100GPT-5.1 100GPT-5.4 Mini (Reasoning)	33GPT-4o, Aug. 6th (temp=0) 40Gemini 2.5 Flash Lite 47Qwen 2.5 72B
99.1%	Dialogue tag variety (said vs. fancy)	100GPT-5 100Claude Opus 4.5 100Qwen3.7 Max	11Gemini 3.5 Flash (Reasoning, Minimal) 13Hermes 3 70B 19Cydonia 24B V4.1
55.9%	Em-dash & semicolon overuse	100Qwen 3.5 35B 100GPT-5.4 Mini (Reasoning) 100GPT-5.4	0ByteDance Seed 1.6 0Claude Opus 4.6 0GPT-4o, Aug. 6th (temp=1)
100.0%	Emotion telling (show vs. tell)	100Grok 4.5 (Reasoning, High) 100GPT-5.4 100GPT-4.1 Mini	89Mistral Small 3.2 24B 90Mistral NeMO 91GPT-4o Mini (temp=1)
98.8%	Filter word density	100GPT-5.5 (Reasoning, Low) 100Ministral 3B 100Mistral Small 3.2 24B	51Nemotron 3 Nano 61Llama 3.1 70B 64Nemotron 3 Super
100.0%	Gibberish response detection	100Z.AI GLM 4.6 100GPT-5.5 (Reasoning, Low) 100o4 Mini High	81Llama 3.1 70B 99Hermes 3 70B 99Cydonia 24B V4.1
100.0%	Markdown formatting overuse	100GPT-5 Nano 100GPT-5.5 (Reasoning, Low) 100Claude Sonnet 4.6	80Ministral 3B 80Qwen 3.5 9B 100ByteDance Seed 1.6 Flash
100.0%	Missing dialogue indicators (quotation marks)	100Cydonia 24B V4.1 100Z.AI GLM 4.7 100Aion 3.0 Mini	71Qwen 3.5 Flash 80Qwen 3.6 Flash 80Qwen 3.5 35B
86.6%	Name drop frequency	100Gemini 2.5 Pro 100Z.AI GLM 4.7 Flash 100DeepSeek V3.1	0GPT-5.4 Nano (Reasoning, Low) 7GPT-5.4 Nano (Reasoning) 8Ministral 3B
85.5%	Narrator intent-glossing	100Claude Opus 4.8 (Reasoning) 100Gemini 3.5 Flash (Reasoning, Minimal) 100Qwen 3.5 27B	2GPT-5 Nano 11Nemotron 3 Nano 13Nemotron 3 Super
100.0%	Overuse of "that" (subordinate clause padding)	100ByteDance Seed 1.6 Flash 100Hermes 3 70B 100DeepSeek V3.2	40ByteDance Seed 2.0 Mini 76Ministral 3 8B 77ByteDance Seed 1.6
100.0%	Paragraph length variance	100MoonshotAI: Kimi K2.6 100Claude Sonnet 5 100Claude Sonnet 4.6	39Arcee AI: Trinity Mini 48Grok 4.3 (Reasoning) 53Nemotron 3 Nano
99.6%	Passive voice overuse	100Qwen 3.6 27B 100Qwen 3.5 Plus (2026-02-15) 100Gemini 3.1 Pro (Preview)	89ByteDance Seed 2.0 Mini 91ByteDance Seed 1.6 93GPT-4o, Aug. 6th (temp=0)
100.0%	Past progressive (was/were + -ing) overuse	100Qwen 3.5 27B 100Gemma 4 31B 100Gemini 3.1 Pro (Preview)	49Claude Sonnet 4.6 57Claude Opus 4.7 57Claude Sonnet 5 (Reasoning)
35.2%	Pronoun-first sentence starts	100Ministral 3B 93Z.AI GLM 5 Turbo 92GPT-5.2	0GPT-5 0GPT-4o Mini (temp=0) 1Gemini 3.1 Flash Lite
97.6%	Purple prose (modifier overload)	100Grok 4.3 100DeepSeek V4 Pro 100Inception Mercury 2	51Cydonia 24B V4.1 81GPT-4.1 Nano 83Gemma 3 4B
100.0%	Repeated phrase echo	100ByteDance Seed 1.6 Flash 100Gemma 3 27B 100Gemma 3 4B	—
100.0%	Sentence length variance	100Claude Opus 4.6 (Reasoning) 100Z.AI GLM 5 100DeepSeek V3 (2024-12-26)	90Inception Mercury 2 93Grok 4.3 (Reasoning) 97Llama 3.1 70B
49.4%	Sentence opener variety	86GPT-4o, Aug. 6th (temp=1) 82Claude Sonnet 4 80Hermes 3 405B	31Qwen 3.5 9B 33ByteDance Seed 2.0 Lite 33Gemini 3.1 Flash Lite (Preview)
15.8%	Subject-first sentence starts	57Mistral Small 4 (Reasoning) 55Claude Opus 4 54Claude Opus 4.6 (Reasoning)	0Gemma 4 26B 0Gemini 3 Flash (Preview) 0Gemma 4 26B (Reasoning)
20.0%	Subordinate conjunction sentence starts	73Qwen 3.5 122B 71Claude Sonnet 4 70Gemini 3.1 Flash Lite (Reasoning)	0Ministral 3 3B 0Z.AI GLM 4.6 0GPT-OSS 120B
83.3%	Technical jargon density	100Gemini 3.1 Pro (Preview) 100Qwen 3.5 Flash 100GPT-4.1 Nano	8GPT-5 Nano 21Claude Sonnet 4.6 23Claude Sonnet 5 (Reasoning)
77.5%	Useless dialogue additions	100Qwen 3.5 35B 100ByteDance Seed 1.6 100Qwen 3.5 Flash	0GPT-4o Mini (temp=0) 0Gemini 3.5 Flash (Reasoning) 0Mistral NeMO

Bad Writing Habits

Romance: separated couple reunites

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)