Character dialogue (German) in a story

Language Writing

Can the model generate text in different languages?

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Claude Opus 4.6 (Reasoning)	100%
Qwen3.6 Max Preview	100%
Gemini 3.1 Pro (Preview)	100%
Z.AI GLM 5.1	100%
Z.AI GLM 5 Turbo	100%
Grok 4.3 (Reasoning)	100%
Claude Opus 4.7 (Reasoning)	100%
GPT-5 Mini	100%
Claude Opus 4.6	100%
MoonshotAI: Kimi K2.6	100%
GPT-5	100%
Qwen 3.5 397B A17B	100%
Gemma 4 31B (Reasoning)	100%
Qwen 3.5 122B	100%
Qwen 3.5 Plus (2026-04-20)	100%
Gemma 4 26B (Reasoning)	100%
Grok 4.20 (Beta, Reasoning)	100%
GPT-5.4 (Reasoning, Low)	100%
Grok 4.20 (Reasoning)	100%
Claude Sonnet 4.6	100%

	Score	Cost	Time
Stealth: Aurora Alpha	100%	—	1.7s
Inception Mercury	98%	$0.0002	1.5s
GPT-4.1 Nano	92%	$0.0001	2.8s
Inception Mercury 2	100%	$0.0006	1.5s
GPT-4.1 Mini	100%	$0.0004	2.6s
GPT-4o Mini (temp=0)	100%	$0.0002	4.3s
Nemotron 3 Super	98%	$0.0000	9.2s
GPT-4o Mini (temp=1)	100%	$0.0003	5.4s
Gemini 2.5 Flash Lite	98%	$0.0005	4.6s
Arcee AI: Trinity Mini	100%	$0.0004	15.0s
Gemini 3.1 Flash Lite (Preview)	100%	$0.0011	3.7s
Gemini 3.1 Flash Lite	100%	$0.0011	3.7s
Grok 4.3	98%	$0.0010	4.3s
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0011	6.3s
Arcee AI: Trinity Large (Preview)	93%	$0.0000	14.1s
Mistral Small 3.2 24B	80%	$0.0003	9.3s
GPT-5.4 Mini	100%	$0.0020	2.4s
Gemini 3 Flash (Preview)	100%	$0.0016	4.6s
Nemotron 3 Nano	100%	$0.0002	10.5s
DeepSeek V4 Flash (Reasoning)	100%	$0.0002	54.4s

	Score	Cost	Speed	Stability
Stealth: Aurora Alpha	100%	—	1.7s	100%
Inception Mercury 2	100%	$0.0006	1.5s	100%
GPT-4.1 Mini	100%	$0.0004	2.6s	100%
GPT-4o Mini (temp=0)	100%	$0.0002	4.3s	100%
GPT-4o Mini (temp=1)	100%	$0.0003	5.4s	100%
Gemini 3.1 Flash Lite	100%	$0.0011	3.7s	100%
Gemini 3.1 Flash Lite (Preview)	100%	$0.0011	3.7s	100%
GPT-5.4 Mini	100%	$0.0020	2.4s	100%
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0011	6.3s	100%
Gemini 3 Flash (Preview)	100%	$0.0016	4.6s	100%
Nemotron 3 Nano	100%	$0.0002	10.5s	100%
Gemini 2.5 Flash	100%	$0.0023	5.4s	100%
GPT-5.4 Nano (Reasoning)	100%	$0.0019	7.5s	100%
DeepSeek-V2 Chat	100%	$0.0001	13.8s	100%
Arcee AI: Trinity Mini	100%	$0.0004	15.0s	100%
Z.AI GLM 4.5	100%	$0.0012	12.7s	100%
GPT-5.4 Mini (Reasoning, Low)	99%	$0.0025	4.2s	98%
GPT-5.4 Mini (Reasoning)	100%	$0.0036	4.7s	100%
GPT-5.4 Nano	99%	$0.0018	7.0s	98%
Grok 4.20	100%	$0.0023	11.5s	100%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	Total
113	Claude Opus 4.6 (Reasoning)	$0.039	36.1s	100%	100	100	100	100	100	100%
142	Qwen3.6 Max Preview	$0.034	2.4m	100%	100	100	100	100	100	100%
110	Gemini 3.1 Pro (Preview)	$0.037	38.3s	100%	100	100	100	100	100	100%
48	Z.AI GLM 5.1	$0.0044	28.9s	100%	100	100	100	100	100	100%
33	Z.AI GLM 5 Turbo	$0.0038	16.4s	100%	100	100	100	100	100	100%
92	Grok 4.3 (Reasoning)	$0.011	1.1m	100%	100	100	100	100	100	100%
104	Claude Opus 4.7 (Reasoning)	$0.039	17.6s	100%	100	100	100	100	100	100%
58	GPT-5 Mini	$0.0069	37.2s	100%	100	100	100	100	100	100%
103	Claude Opus 4.6	$0.031	30.9s	100%	100	100	100	100	100	100%
119	MoonshotAI: Kimi K2.6	$0.018	2.0m	100%	100	100	100	100	100	100%
134	GPT-5	$0.046	1.3m	100%	100	100	100	100	100	100%
123	Qwen 3.5 397B A17B	$0.016	2.2m	100%	100	100	100	100	100	100%
78	Gemma 4 31B (Reasoning)	$0.0005	1.3m	100%	100	100	100	100	100	100%
82	Qwen 3.5 122B	$0.013	40.6s	100%	100	100	100	100	100	100%
90	Qwen 3.5 Plus (2026-04-20)	$0.010	1.1m	100%	100	100	100	100	100	100%
69	Gemma 4 26B (Reasoning)	$0.0010	1.1m	100%	100	100	100	100	100	100%
88	Grok 4.20 (Beta, Reasoning)	$0.024	17.0s	100%	100	100	100	100	100	100%
57	GPT-5.4 (Reasoning, Low)	$0.013	17.5s	100%	100	100	100	100	100	100%
81	Grok 4.20 (Reasoning)	$0.0095	49.9s	100%	100	100	100	100	100	100%
49	Claude Sonnet 4.6	$0.0098	12.4s	100%	100	100	100	100	100	100%
86	MoonshotAI: Kimi K2.5	$0.0081	1.1m	100%	100	100	100	100	100	100%
74	Qwen 3.5 27B	$0.0094	43.9s	100%	100	100	100	100	100	100%
66	ByteDance Seed 1.6	$0.0043	52.4s	100%	100	100	100	100	100	100%
18	GPT-5.4 Mini (Reasoning)	$0.0036	4.7s	100%	100	100	100	100	100	100%
50	DeepSeek V4 Pro (Reasoning)	$0.0011	41.8s	100%	100	100	100	100	100	100%
100	Qwen 3.6 27B	$0.013	1.2m	100%	100	100	100	100	100	100%
51	Qwen 3.6 35B	$0.0048	32.4s	100%	100	100	100	100	100	100%
55	DeepSeek V4 Flash (Reasoning)	$0.0002	54.4s	100%	100	100	100	100	100	100%
118	Z.AI GLM 4.7	$0.0052	2.7m	100%	100	100	100	100	100	100%
23	GPT-4.1	$0.0042	6.4s	100%	100	100	100	100	100	100%
47	o4 Mini	$0.0066	17.7s	100%	100	100	100	100	100	100%
89	Grok 4	$0.018	36.4s	100%	100	100	100	100	100	100%
22	Gemma 4 31B	$0.0003	19.3s	100%	100	100	100	100	100	100%
34	Gemini 2.5 Flash (Reasoning)	$0.0057	10.6s	100%	100	100	100	100	100	100%
32	GPT-OSS 120B	$0.0004	26.4s	100%	100	100	100	100	100	100%
9	Gemini 3.1 Flash Lite (Reasoning)	$0.0011	6.3s	100%	100	100	100	100	100	100%
16	Z.AI GLM 4.5	$0.0012	12.7s	100%	100	100	100	100	100	100%
44	Qwen 3.5 Plus (2026-02-15)	$0.0019	32.4s	100%	100	100	100	100	100	100%
7	Gemini 3.1 Flash Lite (Preview)	$0.0011	3.7s	100%	100	100	100	100	100	100%
6	Gemini 3.1 Flash Lite	$0.0011	3.7s	100%	100	100	100	100	100	100%
40	GPT-4o, May 13th (temp=0)	$0.0088	7.6s	100%	100	100	100	100	100	100%
10	Gemini 3 Flash (Preview)	$0.0016	4.6s	100%	100	100	100	100	100	100%
14	DeepSeek-V2 Chat	$0.0001	13.8s	100%	100	100	100	100	100	100%
96	ByteDance Seed 2.0 Lite	$0.0072	1.4m	100%	100	100	100	100	100	100%
2	Inception Mercury 2	$0.0006	1.5s	100%	100	100	100	100	100	100%
1	Stealth: Aurora Alpha	—	1.7s	100%	100	100	100	100	100	100%
3	GPT-4.1 Mini	$0.0004	2.6s	100%	100	100	100	100	100	100%
30	GPT-4o, Aug. 6th (temp=1)	$0.0057	6.5s	100%	100	100	100	100	100	100%
75	GPT-5 Nano	$0.0028	1.1m	100%	100	100	100	100	100	100%
27	GPT-4o, Aug. 6th (temp=0)	$0.0051	6.8s	100%	100	100	100	100	100	100%
8	GPT-5.4 Mini	$0.0020	2.4s	100%	100	100	100	100	100	100%
31	DeepSeek V3.1	$0.0006	25.6s	100%	100	100	100	100	100	100%
20	Grok 4.20	$0.0023	11.5s	100%	100	100	100	100	100	100%
13	GPT-5.4 Nano (Reasoning)	$0.0019	7.5s	100%	100	100	100	100	100	100%
12	Gemini 2.5 Flash	$0.0023	5.4s	100%	100	100	100	100	100	100%
24	Mistral Large	$0.0032	9.8s	100%	100	100	100	100	100	100%
5	GPT-4o Mini (temp=1)	$0.0003	5.4s	100%	100	100	100	100	100	100%
4	GPT-4o Mini (temp=0)	$0.0002	4.3s	100%	100	100	100	100	100	100%
11	Nemotron 3 Nano	$0.0002	10.5s	100%	100	100	100	100	100	100%
15	Arcee AI: Trinity Mini	$0.0004	15.0s	100%	100	100	100	100	100	100%
64	GPT-5.4	$0.013	19.2s	99%	100	100	100	100	99	100%
80	GPT-5.4 (Reasoning)	$0.016	24.1s	99%	100	100	100	100	98	100%
17	GPT-5.4 Mini (Reasoning, Low)	$0.0025	4.2s	98%	100	100	100	100	97	99%
19	GPT-5.4 Nano	$0.0018	7.0s	98%	100	100	100	98	98	99%
107	GPT-5.5 (Reasoning)	$0.037	24.7s	97%	100	100	99	99	98	99%
106	Claude Opus 4.7	$0.038	18.0s	96%	100	100	100	100	95	99%
93	Claude Sonnet 4.6 (Reasoning)	$0.020	26.2s	96%	100	100	100	100	95	99%
85	Claude Opus 4.5	$0.019	16.4s	96%	100	100	100	100	95	99%
60	Claude 3.7 Sonnet	$0.012	14.4s	96%	100	100	100	100	95	99%
46	Gemini 3 Flash (Preview, Reasoning)	$0.0052	12.3s	95%	100	100	100	100	94	99%
91	o4 Mini High	$0.015	40.2s	95%	100	100	100	100	94	99%
95	Gemini 2.5 Pro	$0.022	21.4s	95%	100	100	100	100	94	99%
77	Qwen 3.5 Flash	$0.0020	59.8s	95%	100	100	100	100	94	99%
109	GPT-5.5	$0.039	26.6s	97%	100	99	99	98	98	99%
39	MiniMax M2.5	$0.0010	21.1s	94%	100	100	100	100	93	99%
35	Mistral Large 3	$0.0013	15.8s	94%	100	100	100	100	93	99%
43	Xiaomi MIMO v2.5 Pro	$0.0031	20.0s	96%	100	100	100	97	96	99%
26	GPT-5.4 Nano (Reasoning, Low)	$0.0019	7.7s	96%	100	100	100	98	95	98%
61	Qwen 3.6 Flash	$0.0068	27.3s	94%	100	100	100	100	92	98%
38	Grok 4.1 Fast	$0.0008	19.0s	93%	100	100	100	100	92	98%
25	Nemotron 3 Super	$0.0000	9.2s	93%	100	100	100	100	92	98%
45	DeepSeek V3.2	$0.0004	24.8s	93%	100	100	100	100	92	98%
108	GPT-5.5 (Reasoning, Low)	$0.036	25.1s	95%	100	100	98	97	97	98%
70	Aion 2.0	$0.0033	45.8s	93%	100	100	100	100	91	98%
112	ByteDance Seed 2.0 Mini	$0.0022	2.4m	93%	100	100	100	100	91	98%
41	Hermes 3 405B	$0.0000	23.7s	93%	100	100	100	100	91	98%
84	GPT-5.2	$0.015	25.0s	96%	100	99	98	97	96	98%
105	GPT-5.1	$0.024	48.9s	92%	100	100	100	100	90	98%
62	Claude 3.5 Sonnet	$0.0100	17.2s	95%	100	100	100	95	94	98%
36	Grok 4.20 (Beta)	$0.0034	3.7s	91%	100	100	100	100	89	98%
37	DeepSeek V3 (2025-03-24)	$0.0006	14.8s	91%	100	100	100	100	89	98%
28	Gemini 2.5 Flash Lite	$0.0005	4.6s	91%	100	100	100	100	89	98%
21	Inception Mercury	$0.0002	1.5s	91%	100	100	100	100	89	98%
29	Grok 4.3	$0.0010	4.3s	91%	100	100	100	100	89	98%
127	Claude Opus 4	$0.048	23.5s	94%	100	100	100	95	93	98%
56	Claude Sonnet 4	$0.0091	11.1s	93%	100	100	100	93	93	97%
98	Qwen 3.5 9B	$0.0010	1.6m	93%	100	100	100	94	91	97%
54	GPT-4o, May 13th (temp=1)	$0.0090	7.0s	92%	100	100	100	93	91	97%
72	Claude Sonnet 4.5	$0.011	12.7s	90%	100	100	95	94	93	96%
53	Xiaomi MIMO v2.5	$0.0026	15.2s	84%	100	100	100	100	80	96%
42	Gemma 3 4B	$0.0001	12.8s	88%	100	100	100	92	86	96%
101	Z.AI GLM 5	$0.0040	1.3m	87%	100	100	95	95	88	96%
83	Gemma 4 26B	$0.0003	46.7s	82%	100	100	100	100	78	96%
68	Gemma 3 27B	$0.0002	37.6s	87%	100	100	100	92	83	95%
71	Gemma 3 12B	$0.0002	34.3s	83%	100	100	91	91	90	94%
52	Grok 4 Fast	$0.0005	7.1s	80%	100	100	91	89	86	93%
79	Llama 3.1 70B	$0.0006	38.2s	82%	100	100	100	83	80	93%
73	Arcee AI: Trinity Large (Preview)	$0.0000	14.1s	71%	100	100	100	100	63	93%
76	DeepSeek V4 Pro	$0.0014	28.8s	81%	100	100	100	83	79	92%
65	Claude Haiku 4.5	$0.0033	7.5s	79%	100	100	94	88	79	92%
59	ByteDance Seed 1.6 Flash	$0.0006	15.7s	80%	100	100	100	80	80	92%
67	GPT-4.1 Nano	$0.0001	2.8s	68%	100	100	100	100	60	92%
63	Stealth: Healer Alpha	$0.0000	14.9s	78%	100	100	100	85	73	92%
87	Z.AI GLM 4.5 Air	$0.0011	22.6s	67%	100	100	100	100	58	92%
99	Z.AI GLM 4.7 Flash	$0.0011	48.9s	70%	100	100	100	88	62	90%
94	Mistral Small 4	$0.0004	6.3s	56%	100	100	80	73	63	83%
102	Stealth: Hunter Alpha	$0.0000	18.6s	54%	100	100	87	67	53	81%
97	LFM2 24B	$0.0001	9.5s	55%	100	100	90	57	57	81%
143	Gemini 3 Pro (Preview)	$0.027	20.7s	20%	100	100	100	100	0	80%
130	Qwen 3.5 35B	$0.0077	25.6s	20%	100	100	100	100	0	80%
120	DeepSeek V3 (2024-12-26)	$0.0006	17.3s	20%	100	100	100	100	0	80%
125	Qwen 3 32B	$0.0005	27.1s	20%	100	100	100	100	0	80%
115	Mistral Small 3.2 24B	$0.0003	9.3s	20%	100	100	100	100	0	80%
121	Gemini 2.5 Flash Lite (Reasoning)	$0.0017	17.3s	22%	100	100	100	90	0	78%
141	Z.AI GLM 4.6	$0.0047	1.3m	21%	100	100	95	94	0	78%
117	DeepSeek V4 Flash	$0.0002	13.3s	21%	100	100	92	92	0	77%
114	Llama 3.1 8B	$0.0001	3.8s	21%	100	100	91	90	0	76%
124	MiniMax M2.7	$0.0012	20.2s	22%	100	100	92	86	0	75%
122	Hermes 3 70B	$0.0002	13.5s	22%	100	100	100	60	0	72%
126	Mistral Small 4 (Reasoning)	$0.0012	17.6s	21%	100	100	98	53	0	70%
129	Rocinante 12B	$0.0004	27.3s	21%	100	100	80	67	0	69%
116	Claude 3 Haiku	$0.0006	3.6s	24%	100	100	50	50	43	69%
111	Cohere Command R+ (Aug. 2024)	$0.0065	16.0s	53%	86	75	70	62	50	68%
140	Mistral Large 2	$0.0040	17.9s	2%	100	100	100	0	0	60%
133	Mistral Medium 3.1	$0.0019	17.0s	13%	100	100	50	50	0	60%
131	Ministral 3 3B	$0.0001	2.8s	5%	100	100	90	0	0	58%
137	Llama 3.1 Nemotron 70B	$0.0003	20.5s	5%	100	100	86	0	0	57%
135	Qwen3 235B A22B Instruct 2507	$0.0003	14.1s	6%	100	100	67	0	0	53%
132	Ministral 8B	$0.0001	4.0s	9%	100	92	69	0	0	52%
138	WizardLM 2 8x22b	$0.0008	16.3s	9%	100	88	63	0	0	50%
128	Ministral 3B	$0.0000	3.7s	29%	67	64	58	58	0	49%
139	Mistral NeMO	$0.0001	4.8s	3%	100	100	33	0	0	47%
144	Qwen 2.5 72B	$0.0004	21.5s	0%	100	100	0	0	0	40%
136	Mistral Small Creative	$0.0004	7.0s	26%	50	50	50	0	0	30%
146	Writer: Palmyra X5	$0.0049	10.6s	0%	100	0	0	0	0	20%
145	Ministral 3 8B	$0.0002	5.3s	0%	68	0	0	0	0	14%
147	Ministral 3 14B	$0.0003	8.5s	0%	0	0	0	0	0	0%
90.45%

Language Writing

Character dialogue (German) in a story

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)