Write sentences with 20 words each

N-Length Sentences

Write sentences with exactly N words

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Claude Opus 4.6 (Reasoning)	100%
Qwen3.6 Max Preview	100%
Gemini 3.1 Pro (Preview)	100%
Z.AI GLM 5.1	100%
Z.AI GLM 5 Turbo	100%
Claude Sonnet 4.6 (Reasoning)	100%
Grok 4.3 (Reasoning)	100%
GPT-5.1	100%
MoonshotAI: Kimi K2.6	100%
GPT-5	100%
Qwen 3.5 397B A17B	100%
Gemma 4 31B (Reasoning)	100%
Qwen 3.5 122B	100%
GPT-5.4 (Reasoning, Low)	100%
MoonshotAI: Kimi K2.5	100%
Qwen 3.5 27B	100%
ByteDance Seed 1.6	100%
GPT-5.4 Mini (Reasoning)	100%
Gemini 3 Flash (Preview, Reasoning)	100%
o4 Mini High	100%

	Score	Cost	Time
Gemini 3.1 Flash Lite (Preview)	100%	$0.0001	1.4s
Gemini 3.1 Flash Lite	100%	$0.0002	1.2s
Gemini 3.1 Flash Lite (Reasoning)	94%	$0.0001	4.1s
Inception Mercury	95%	$0.0001	2.0s
Stealth: Aurora Alpha	98%	—	2.1s
Inception Mercury 2	100%	$0.0008	1.4s
Gemini 3 Flash (Preview)	97%	$0.0005	2.3s
GPT-5.4 Nano (Reasoning, Low)	99%	$0.0011	6.7s
GPT-5.4 Nano (Reasoning)	100%	$0.0013	9.3s
Nemotron 3 Super	100%	$0.0000	19.1s
GPT-5.4 Mini (Reasoning, Low)	100%	$0.0040	8.4s
GPT-OSS 120B	100%	$0.0005	20.9s
GPT-5.4 Mini (Reasoning)	100%	$0.0060	10.9s
Gemma 4 26B	88%	$0.0001	3.3s
ByteDance Seed 1.6 Flash	92%	$0.0009	16.4s
Stealth: Healer Alpha	78%	$0.0000	16.6s
Nemotron 3 Nano	100%	$0.0005	31.4s
GPT-5 Nano	100%	$0.0014	37.4s
ByteDance Seed 1.6	100%	$0.0032	36.1s
Gemini 3 Flash (Preview, Reasoning)	100%	$0.012	19.9s

	Score	Cost	Speed	Stability
Gemini 3.1 Flash Lite	100%	$0.0002	1.2s	100%
Gemini 3.1 Flash Lite (Preview)	100%	$0.0001	1.4s	100%
Inception Mercury 2	100%	$0.0008	1.4s	100%
GPT-5.4 Nano (Reasoning)	100%	$0.0013	9.3s	100%
GPT-5.4 Mini (Reasoning, Low)	100%	$0.0040	8.4s	100%
GPT-5.4 Mini (Reasoning)	100%	$0.0060	10.9s	100%
Nemotron 3 Super	100%	$0.0000	19.1s	100%
GPT-OSS 120B	100%	$0.0005	20.9s	100%
Gemini 3 Flash (Preview)	97%	$0.0005	2.3s	93%
GPT-5.4 Nano (Reasoning, Low)	99%	$0.0011	6.7s	91%
Nemotron 3 Nano	100%	$0.0005	31.4s	100%
GPT-5.4 (Reasoning, Low)	100%	$0.014	13.9s	100%
Gemini 3 Flash (Preview, Reasoning)	100%	$0.012	19.9s	100%
GPT-5.2	100%	$0.015	18.4s	100%
GPT-5 Nano	100%	$0.0014	37.4s	100%
ByteDance Seed 1.6	100%	$0.0032	36.1s	100%
o4 Mini	100%	$0.011	25.9s	100%
Inception Mercury	95%	$0.0001	2.0s	85%
Qwen 3.5 Flash	100%	$0.0027	40.1s	100%
GPT-5.1	100%	$0.015	24.4s	100%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	# 6	# 7	# 8	# 9	# 10	Total
54	Claude Opus 4.6 (Reasoning)	$0.087	39.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
76	Qwen3.6 Max Preview	$0.048	2.6m	100%	100	100	100	100	100	100	100	100	100	100	100%
51	Gemini 3.1 Pro (Preview)	$0.060	51.8s	100%	100	100	100	100	100	100	100	100	100	100	100%
52	Z.AI GLM 5.1	$0.019	1.8m	100%	100	100	100	100	100	100	100	100	100	100	100%
26	Z.AI GLM 5 Turbo	$0.016	39.2s	100%	100	100	100	100	100	100	100	100	100	100	100%
90	Claude Sonnet 4.6 (Reasoning)	$0.159	1.6m	100%	100	100	100	100	100	100	100	100	100	100	100%
24	Grok 4.3 (Reasoning)	$0.0081	42.5s	100%	100	100	100	100	100	100	100	100	100	100	100%
20	GPT-5.1	$0.015	24.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
56	MoonshotAI: Kimi K2.6	$0.015	2.3m	100%	100	100	100	100	100	100	100	100	100	100	100%
40	GPT-5	$0.030	49.8s	100%	100	100	100	100	100	100	100	100	100	100	100%
77	Qwen 3.5 397B A17B	$0.026	3.2m	100%	100	100	100	100	100	100	100	100	100	100	100%
74	Gemma 4 31B (Reasoning)	$0.0016	3.5m	100%	100	100	100	100	100	100	100	100	100	100	100%
38	Qwen 3.5 122B	$0.023	50.0s	100%	100	100	100	100	100	100	100	100	100	100	100%
12	GPT-5.4 (Reasoning, Low)	$0.014	13.9s	100%	100	100	100	100	100	100	100	100	100	100	100%
36	MoonshotAI: Kimi K2.5	$0.011	1.1m	100%	100	100	100	100	100	100	100	100	100	100	100%
45	Qwen 3.5 27B	$0.019	1.3m	100%	100	100	100	100	100	100	100	100	100	100	100%
16	ByteDance Seed 1.6	$0.0032	36.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
6	GPT-5.4 Mini (Reasoning)	$0.0060	10.9s	100%	100	100	100	100	100	100	100	100	100	100	100%
13	Gemini 3 Flash (Preview, Reasoning)	$0.012	19.9s	100%	100	100	100	100	100	100	100	100	100	100	100%
23	o4 Mini High	$0.014	34.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
14	GPT-5.2	$0.015	18.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
21	MiniMax M2.7	$0.0040	44.9s	100%	100	100	100	100	100	100	100	100	100	100	100%
17	o4 Mini	$0.011	25.9s	100%	100	100	100	100	100	100	100	100	100	100	100%
29	Qwen 3.5 35B	$0.015	44.0s	100%	100	100	100	100	100	100	100	100	100	100	100%
57	ByteDance Seed 2.0 Mini	$0.0025	2.6m	100%	100	100	100	100	100	100	100	100	100	100	100%
8	GPT-OSS 120B	$0.0005	20.9s	100%	100	100	100	100	100	100	100	100	100	100	100%
19	Qwen 3.5 Flash	$0.0027	40.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
53	Qwen 3.5 9B	$0.0013	2.2m	100%	100	100	100	100	100	100	100	100	100	100	100%
2	Gemini 3.1 Flash Lite (Preview)	$0.0001	1.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
1	Gemini 3.1 Flash Lite	$0.0002	1.2s	100%	100	100	100	100	100	100	100	100	100	100	100%
5	GPT-5.4 Mini (Reasoning, Low)	$0.0040	8.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
7	Nemotron 3 Super	$0.0000	19.1s	100%	100	100	100	100	100	100	100	100	100	100	100%
3	Inception Mercury 2	$0.0008	1.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
15	GPT-5 Nano	$0.0014	37.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
4	GPT-5.4 Nano (Reasoning)	$0.0013	9.3s	100%	100	100	100	100	100	100	100	100	100	100	100%
11	Nemotron 3 Nano	$0.0005	31.4s	100%	100	100	100	100	100	100	100	100	100	100	100%
35	GPT-5.5 (Reasoning)	$0.039	18.6s	97%	100	100	100	100	100	100	100	100	100	96	100%
27	GPT-5.5 (Reasoning, Low)	$0.029	14.9s	97%	100	100	100	100	100	100	100	100	100	95	100%
25	GPT-5.4 (Reasoning)	$0.021	23.3s	97%	100	100	100	100	100	100	100	100	100	94	99%
41	ByteDance Seed 2.0 Lite	$0.0062	1.2m	96%	100	100	100	100	100	100	100	100	100	93	99%
10	GPT-5.4 Nano (Reasoning, Low)	$0.0011	6.7s	91%	100	100	100	100	100	100	100	100	100	86	99%
46	Claude Opus 4.7 (Reasoning)	$0.064	14.5s	90%	100	100	100	100	100	100	100	100	100	83	98%
58	Gemma 4 26B (Reasoning)	$0.0023	2.3m	90%	100	100	100	100	100	100	100	100	100	83	98%
28	Grok 4.20 (Reasoning)	$0.0078	26.8s	90%	100	100	100	100	100	100	100	100	100	83	98%
31	GPT-5 Mini	$0.0056	32.6s	90%	100	100	100	100	100	100	100	100	100	83	98%
63	Z.AI GLM 5	$0.017	2.3m	88%	100	100	100	100	100	100	100	100	100	80	98%
30	Grok 4.20 (Beta, Reasoning)	$0.018	9.7s	87%	100	100	100	100	100	100	100	100	100	78	98%
61	Qwen 3.5 Plus (2026-04-20)	$0.016	2.1m	86%	100	100	100	100	100	100	100	100	100	76	98%
42	MiniMax M2.5	$0.0038	56.4s	85%	100	100	100	100	100	100	100	100	100	75	98%
22	Stealth: Aurora Alpha	—	2.1s	85%	100	100	100	100	100	100	100	100	100	75	98%
9	Gemini 3 Flash (Preview)	$0.0005	2.3s	93%	100	100	100	100	100	100	95	95	94	90	97%
33	Gemini 3 Pro (Preview)	$0.019	12.7s	88%	100	100	100	100	100	100	100	100	93	80	97%
39	Qwen 3.6 Flash	$0.011	31.6s	83%	100	100	100	100	100	100	100	100	100	72	97%
44	Qwen 3.6 35B	$0.0060	35.6s	76%	100	100	100	100	100	100	100	100	100	61	96%
18	Inception Mercury	$0.0001	2.0s	85%	100	100	100	100	100	100	100	84	84	84	95%
89	Z.AI GLM 4.7	$0.0092	3.5m	71%	100	100	100	100	100	100	100	100	100	51	95%
60	Qwen 3.6 27B	$0.022	1.6m	81%	100	100	100	100	100	100	100	92	90	69	95%
37	Mistral Small 4 (Reasoning)	$0.0026	29.2s	84%	100	100	100	100	94	93	90	90	89	84	94%
32	Gemini 3.1 Flash Lite (Reasoning)	$0.0001	4.1s	76%	100	100	100	100	100	100	100	100	70	70	94%
59	Aion 2.0	$0.0066	1.6m	73%	100	100	100	100	100	100	100	93	92	54	94%
34	ByteDance Seed 1.6 Flash	$0.0009	16.4s	80%	100	100	100	100	100	100	87	83	78	75	92%
69	Z.AI GLM 4.7 Flash	$0.0027	1.9m	70%	100	100	100	100	100	93	90	74	74	60	89%
43	Gemma 4 26B	$0.0001	3.3s	66%	100	100	100	100	100	92	92	74	61	61	88%
49	Claude Opus 4.5	$0.0061	7.6s	64%	100	96	88	88	84	80	75	75	74	60	82%
50	GPT-5.4 Mini	$0.0007	1.4s	60%	100	92	87	83	78	76	74	74	70	59	79%
47	GPT-4.1	$0.0014	3.1s	64%	93	92	85	84	84	80	72	72	67	57	79%
66	Stealth: Healer Alpha	$0.0000	16.6s	36%	100	100	100	100	100	100	92	37	34	20	78%
55	Claude Opus 4.7	$0.010	6.0s	62%	83	80	80	80	77	76	73	70	66	50	73%
64	GPT-4o, May 13th (temp=0)	$0.0032	5.0s	41%	100	100	88	85	80	80	73	64	43	18	73%
48	GPT-4o Mini (temp=0)	$0.0002	3.4s	70%	72	72	72	72	72	72	72	72	72	68	71%
65	GPT-5.4	$0.0019	4.5s	44%	100	90	80	70	67	66	59	59	51	40	68%
62	Gemma 4 31B	$0.0001	8.0s	48%	90	84	66	65	61	61	61	61	61	61	67%
68	Grok 4	$0.0091	19.2s	51%	84	78	76	69	68	68	67	61	54	39	66%
72	Claude Opus 4	$0.017	15.3s	52%	83	75	70	66	66	61	61	61	56	53	65%
73	GPT-4o Mini (temp=1)	$0.0001	6.3s	39%	100	80	76	72	70	65	59	55	34	23	63%
110	DeepSeek V4 Pro (Reasoning)	$0.0058	1.9m	12%	100	100	100	100	93	70	63	0	0	0	63%
78	Gemini 2.5 Pro	$0.018	16.0s	40%	83	80	80	80	78	59	57	51	38	20	63%
67	Mistral Medium 3.1	$0.0005	5.4s	48%	76	72	68	68	67	61	58	57	54	29	61%
70	GPT-4.1 Nano	$0.0001	3.4s	43%	76	76	76	65	64	59	59	57	38	30	60%
71	Qwen 2.5 72B	$0.0000	2.2s	41%	100	61	61	61	61	61	61	61	40	35	60%
80	Claude Opus 4.6	$0.0071	9.1s	27%	100	93	80	61	55	47	47	37	37	32	59%
79	GPT-4o, May 13th (temp=1)	$0.0027	5.0s	30%	92	87	75	67	64	54	48	39	30	11	57%
75	Llama 3.1 70B	$0.0002	2.9s	42%	74	69	60	58	54	53	50	46	43	38	55%
81	Claude Sonnet 4.5	$0.0045	7.7s	29%	92	72	69	65	59	58	49	42	20	2	53%
85	Claude Sonnet 4	$0.0038	6.2s	23%	91	78	76	72	66	49	32	17	12	3	50%
83	GPT-4.1 Mini	$0.0003	2.3s	25%	87	82	59	59	51	42	38	34	32	4	49%
82	Llama 3.1 Nemotron 70B	$0.0001	7.4s	32%	66	60	53	52	45	39	39	37	29	29	45%
102	Xiaomi MIMO v2.5 Pro	$0.0059	27.0s	3%	100	100	92	88	23	20	19	1	0	0	44%
87	Llama 3.1 8B	$0.0000	1.0s	20%	84	74	74	48	45	33	27	24	21	5	44%
84	Gemini 2.5 Flash Lite (Reasoning)	$0.0005	5.2s	31%	67	65	55	53	52	49	35	25	13	10	42%
86	Claude 3.7 Sonnet	$0.0037	5.1s	31%	59	53	52	47	47	45	45	27	24	2	40%
88	Ministral 3 14B	$0.0001	3.5s	27%	65	51	49	46	44	42	32	32	4	3	37%
93	Qwen3 235B A22B Instruct 2507	$0.0002	10.1s	19%	75	58	57	39	39	31	24	13	12	0	35%
91	GPT-5.5	$0.0041	4.9s	25%	59	59	43	42	42	37	31	18	10	2	34%
94	Writer: Palmyra X5	$0.0020	12.9s	21%	71	58	51	44	38	37	22	14	8	0	34%
104	Grok 4.1 Fast	$0.0010	13.8s	3%	100	95	85	21	19	15	2	0	0	0	34%
92	GPT-4o, Aug. 6th (temp=1)	$0.0020	2.9s	19%	59	57	52	46	34	27	22	14	12	9	33%
96	Qwen 3 32B	$0.0004	14.3s	21%	56	55	48	47	38	28	24	20	7	3	33%
107	DeepSeek V4 Flash (Reasoning)	$0.0004	23.4s	0%	100	100	100	20	0	0	0	0	0	0	32%
99	Claude Sonnet 4.6	$0.0037	6.4s	10%	87	77	34	32	23	23	22	15	1	0	31%
97	DeepSeek V3 (2025-03-24)	$0.0002	12.0s	14%	74	58	51	39	27	24	18	11	8	0	31%
95	Gemma 3 27B	$0.0001	7.9s	20%	60	56	53	47	44	28	17	2	2	2	31%
105	Stealth: Hunter Alpha	$0.0000	10.0s	4%	83	72	66	56	25	0	0	0	0	0	30%
98	Claude Haiku 4.5	$0.0011	3.3s	10%	67	66	57	50	36	10	0	0	0	0	29%
101	Claude 3.5 Sonnet	$0.0038	5.5s	11%	51	47	45	40	19	16	13	13	6	1	25%
103	DeepSeek V3 (2024-12-26)	$0.0003	10.4s	14%	49	44	35	21	21	19	18	10	2	0	22%
100	Mistral Small Creative	$0.0001	1.8s	14%	44	40	28	27	22	18	16	13	3	0	21%
111	Xiaomi MIMO v2.5	$0.0016	8.3s	0%	100	83	21	5	1	0	0	0	0	0	21%
109	Mistral Small 3.2 24B	$0.0001	4.0s	4%	51	47	27	19	7	5	1	0	0	0	16%
106	GPT-4o, Aug. 6th (temp=0)	$0.0016	2.5s	12%	25	19	17	15	13	13	12	12	12	11	15%
108	Mistral Small 4	$0.0001	1.9s	8%	49	25	19	16	13	9	6	0	0	0	14%
112	Grok 4.20	$0.0004	2.7s	0%	47	42	34	11	0	0	0	0	0	0	14%
113	Gemini 2.5 Flash (Reasoning)	$0.0041	7.5s	5%	51	34	12	10	9	6	3	1	0	0	13%
147	Z.AI GLM 4.6	$0.0053	1.3m	3%	59	36	7	6	5	3	2	0	0	0	12%
122	Z.AI GLM 4.5 Air	$0.0007	17.7s	3%	37	32	31	7	7	2	0	0	0	0	12%
114	Grok 4.20 (Beta)	$0.0008	1.2s	2%	66	15	11	5	3	3	2	0	0	0	10%
118	Gemini 2.5 Flash Lite	$0.0001	1.0s	1%	47	34	4	2	2	0	0	0	0	0	9%
123	WizardLM 2 8x22b	$0.0003	12.0s	2%	41	21	14	5	5	1	1	0	0	0	9%
117	Grok 4 Fast	$0.0003	4.1s	3%	33	23	15	8	7	1	0	0	0	0	9%
115	Hermes 3 70B	$0.0001	7.6s	5%	27	16	15	8	7	6	0	0	0	0	8%
116	GPT-5.4 Nano	$0.0002	1.7s	3%	47	11	4	4	4	3	3	1	0	0	8%
119	Ministral 3B	$0.0000	1.0s	2%	23	19	15	11	4	0	0	0	0	0	7%
120	Claude 3 Haiku	$0.0002	2.7s	2%	27	15	13	10	4	0	0	0	0	0	7%
121	Ministral 3 3B	$0.0000	1.4s	1%	23	19	10	4	2	2	0	0	0	0	6%
124	Gemma 3 12B	$0.0000	6.7s	2%	13	13	9	9	2	2	2	0	0	0	5%
125	Cohere Command R+ (Aug. 2024)	$0.0010	2.6s	0%	25	19	0	0	0	0	0	0	0	0	4%
129	Qwen 3.5 Plus (2026-02-15)	$0.0004	9.5s	1%	23	12	3	3	2	0	0	0	0	0	4%
138	Hermes 3 405B	$0.0000	13.7s	0%	20	16	0	0	0	0	0	0	0	0	4%
127	Grok 4.3	$0.0002	1.6s	0%	30	1	0	0	0	0	0	0	0	0	3%
135	DeepSeek V4 Pro	$0.0003	8.6s	0%	12	6	6	4	0	0	0	0	0	0	3%
128	Gemma 3 4B	$0.0000	2.5s	0%	12	10	2	1	0	0	0	0	0	0	3%
126	Ministral 8B	$0.0000	1.4s	1%	13	7	2	2	1	0	0	0	0	0	2%
130	Arcee AI: Trinity Mini	$0.0001	3.5s	0%	8	8	7	0	0	0	0	0	0	0	2%
142	DeepSeek V3.1	$0.0001	11.1s	0%	7	6	0	0	0	0	0	0	0	0	1%
131	Ministral 3 8B	$0.0001	2.5s	0%	9	1	0	0	0	0	0	0	0	0	1%
132	LFM2 24B	$0.0000	3.5s	0%	6	2	0	0	0	0	0	0	0	0	1%
145	Mistral Large	$0.0048	6.2s	0%	6	0	0	0	0	0	0	0	0	0	1%
141	Mistral Large 3	$0.0006	8.3s	0%	2	1	1	1	0	0	0	0	0	0	0%
139	DeepSeek V4 Flash	$0.0000	6.4s	0%	2	0	0	0	0	0	0	0	0	0	0%
134	Mistral NeMO	$0.0000	2.7s	0%	2	0	0	0	0	0	0	0	0	0	0%
144	DeepSeek V3.2	$0.0001	10.2s	0%	1	0	0	0	0	0	0	0	0	0	0%
133	Gemini 2.5 Flash	$0.0005	1.6s	0%	0	0	0	0	0	0	0	0	0	0	0%
136	Arcee AI: Trinity Large (Preview)	$0.0000	3.9s	0%	0	0	0	0	0	0	0	0	0	0	0%
143	Rocinante 12B	$0.0001	9.7s	0%	0	0	0	0	0	0	0	0	0	0	0%
146	DeepSeek-V2 Chat	$0.0001	18.3s	0%	0	0	0	0	0	0	0	0	0	0	0%
140	Z.AI GLM 4.5	$0.0004	5.7s	0%	0	0	0	0	0	0	0	0	0	0	0%
137	Mistral Large 2	$0.0009	4.2s	0%	0	0	0	0	0	0	0	0	0	0	0%
58.70%

N-Length Sentences

Write sentences with 20 words each

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)