Character dialogue (Italian) in a story

Language Writing

Can the model generate text in different languages?

Performance Score Distribution (Top 20)

Click a model name to view its detail page.

	Score
Claude Opus 4.6 (Reasoning)	100%
Qwen3.6 Max Preview	100%
Gemini 3.1 Pro (Preview)	100%
Grok 4.3 (Reasoning)	100%
GPT-5.4 (Reasoning)	100%
Claude Opus 4.7 (Reasoning)	100%
GPT-5 Mini	100%
Claude Opus 4.6	100%
MoonshotAI: Kimi K2.6	100%
Qwen 3.5 397B A17B	100%
Gemma 4 31B (Reasoning)	100%
Qwen 3.5 Plus (2026-04-20)	100%
Gemma 4 26B (Reasoning)	100%
Grok 4.20 (Beta, Reasoning)	100%
Grok 4.20 (Reasoning)	100%
Z.AI GLM 5	100%
Claude Sonnet 4.6	100%
MoonshotAI: Kimi K2.5	100%
Qwen 3.5 27B	100%
ByteDance Seed 1.6	100%

	Score	Cost	Time
Stealth: Aurora Alpha	100%	—	1.5s
Inception Mercury	100%	$0.0002	1.7s
GPT-4.1 Mini	100%	$0.0004	2.6s
Inception Mercury 2	98%	$0.0006	1.4s
Mistral NeMO	80%	$0.0001	4.5s
GPT-4o Mini (temp=0)	100%	$0.0002	4.6s
GPT-4o Mini (temp=1)	100%	$0.0003	4.4s
Claude 3 Haiku	78%	$0.0005	3.5s
GPT-4.1 Nano	90%	$0.0001	4.6s
Mistral Small 3.2 24B	100%	$0.0003	9.5s
Ministral 3 8B	77%	$0.0002	6.8s
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0011	6.0s
Grok 4.3	100%	$0.0010	4.5s
Arcee AI: Trinity Mini	60%	$0.0002	7.8s
Gemini 3.1 Flash Lite (Preview)	100%	$0.0012	4.0s
Gemini 3.1 Flash Lite	100%	$0.0011	15.1s
DeepSeek-V2 Chat	100%	$0.0001	12.7s
DeepSeek V4 Flash	98%	$0.0002	11.0s
LFM2 24B	85%	$0.0001	11.7s
Nemotron 3 Nano	87%	$0.0002	9.4s

	Score	Cost	Speed	Stability
Stealth: Aurora Alpha	100%	—	1.5s	100%
Inception Mercury	100%	$0.0002	1.7s	100%
GPT-4.1 Mini	100%	$0.0004	2.6s	100%
GPT-4o Mini (temp=1)	100%	$0.0003	4.4s	100%
GPT-4o Mini (temp=0)	100%	$0.0002	4.6s	100%
Grok 4.3	100%	$0.0010	4.5s	100%
Gemini 3.1 Flash Lite (Preview)	100%	$0.0012	4.0s	100%
Gemini 3.1 Flash Lite (Reasoning)	100%	$0.0011	6.0s	100%
GPT-5.4 Mini	100%	$0.0022	2.5s	100%
Mistral Small 3.2 24B	100%	$0.0003	9.5s	100%
GPT-5.4 Mini (Reasoning, Low)	100%	$0.0022	3.2s	100%
GPT-5.4 Nano (Reasoning, Low)	100%	$0.0017	6.7s	100%
DeepSeek-V2 Chat	100%	$0.0001	12.7s	100%
Gemini 3 Flash (Preview)	100%	$0.0021	6.1s	100%
GPT-5.4 Nano (Reasoning)	100%	$0.0015	5.8s	98%
Gemini 2.5 Flash	100%	$0.0026	6.1s	100%
Hermes 3 405B	100%	$0.0000	18.6s	100%
Gemini 3.1 Flash Lite	100%	$0.0011	15.1s	100%
Inception Mercury 2	98%	$0.0006	1.4s	93%
DeepSeek V3.1	100%	$0.0008	17.3s	100%

Rank	Model	Avg. Cost	Avg. Time	Stability	# 1	# 2	# 3	# 4	# 5	Total
114	Claude Opus 4.6 (Reasoning)	$0.039	39.2s	100%	100	100	100	100	100	100%
137	Qwen3.6 Max Preview	$0.035	2.5m	100%	100	100	100	100	100	100%
113	Gemini 3.1 Pro (Preview)	$0.038	42.1s	100%	100	100	100	100	100	100%
85	Grok 4.3 (Reasoning)	$0.011	1.0m	100%	100	100	100	100	100	100%
67	GPT-5.4 (Reasoning)	$0.015	22.5s	100%	100	100	100	100	100	100%
110	Claude Opus 4.7 (Reasoning)	$0.043	20.1s	100%	100	100	100	100	100	100%
53	GPT-5 Mini	$0.0065	32.7s	100%	100	100	100	100	100	100%
108	Claude Opus 4.6	$0.037	35.0s	100%	100	100	100	100	100	100%
129	MoonshotAI: Kimi K2.6	$0.021	2.5m	100%	100	100	100	100	100	100%
107	Qwen 3.5 397B A17B	$0.014	1.9m	100%	100	100	100	100	100	100%
77	Gemma 4 31B (Reasoning)	$0.0005	1.3m	100%	100	100	100	100	100	100%
91	Qwen 3.5 Plus (2026-04-20)	$0.011	1.1m	100%	100	100	100	100	100	100%
60	Gemma 4 26B (Reasoning)	$0.0008	1.0m	100%	100	100	100	100	100	100%
90	Grok 4.20 (Beta, Reasoning)	$0.025	19.7s	100%	100	100	100	100	100	100%
73	Grok 4.20 (Reasoning)	$0.0097	45.2s	100%	100	100	100	100	100	100%
89	Z.AI GLM 5	$0.0067	1.3m	100%	100	100	100	100	100	100%
49	Claude Sonnet 4.6	$0.010	14.3s	100%	100	100	100	100	100	100%
94	MoonshotAI: Kimi K2.5	$0.0088	1.4m	100%	100	100	100	100	100	100%
79	Qwen 3.5 27B	$0.0089	52.5s	100%	100	100	100	100	100	100%
64	ByteDance Seed 1.6	$0.0042	53.2s	100%	100	100	100	100	100	100%
62	Qwen 3.6 Flash	$0.0090	33.5s	100%	100	100	100	100	100	100%
22	GPT-5.4 Mini (Reasoning)	$0.0041	7.6s	100%	100	100	100	100	100	100%
27	Gemini 3 Flash (Preview, Reasoning)	$0.0048	11.4s	100%	100	100	100	100	100	100%
87	o4 Mini High	$0.018	39.4s	100%	100	100	100	100	100	100%
32	DeepSeek V4 Pro (Reasoning)	$0.0010	29.2s	100%	100	100	100	100	100	100%
102	Claude Opus 4.7	$0.035	17.4s	100%	100	100	100	100	100	100%
47	Aion 2.0	$0.0028	39.1s	100%	100	100	100	100	100	100%
56	Z.AI GLM 4.6	$0.0040	44.0s	100%	100	100	100	100	100	100%
118	Z.AI GLM 4.7	$0.0054	2.8m	100%	100	100	100	100	100	100%
23	GPT-4.1	$0.0043	7.5s	100%	100	100	100	100	100	100%
39	o4 Mini	$0.0067	14.4s	100%	100	100	100	100	100	100%
74	Grok 4	$0.014	30.0s	100%	100	100	100	100	100	100%
54	Claude Sonnet 4.5	$0.012	13.9s	100%	100	100	100	100	100	100%
61	Gemma 4 31B	$0.0003	1.1m	100%	100	100	100	100	100	100%
8	Gemini 3.1 Flash Lite (Reasoning)	$0.0011	6.0s	100%	100	100	100	100	100	100%
46	Qwen 3.5 Flash	$0.0021	40.6s	100%	100	100	100	100	100	100%
35	Qwen 3.5 Plus (2026-02-15)	$0.0019	27.1s	100%	100	100	100	100	100	100%
7	Gemini 3.1 Flash Lite (Preview)	$0.0012	4.0s	100%	100	100	100	100	100	100%
38	Gemma 4 26B	$0.0003	35.6s	100%	100	100	100	100	100	100%
18	Gemini 3.1 Flash Lite	$0.0011	15.1s	100%	100	100	100	100	100	100%
11	GPT-5.4 Mini (Reasoning, Low)	$0.0022	3.2s	100%	100	100	100	100	100	100%
37	GPT-4o, May 13th (temp=0)	$0.0084	7.4s	100%	100	100	100	100	100	100%
14	Gemini 3 Flash (Preview)	$0.0021	6.1s	100%	100	100	100	100	100	100%
21	Xiaomi MIMO v2.5	$0.0022	12.9s	100%	100	100	100	100	100	100%
13	DeepSeek-V2 Chat	$0.0001	12.7s	100%	100	100	100	100	100	100%
1	Stealth: Aurora Alpha	—	1.5s	100%	100	100	100	100	100	100%
3	GPT-4.1 Mini	$0.0004	2.6s	100%	100	100	100	100	100	100%
44	Z.AI GLM 4.5 Air	$0.0013	40.3s	100%	100	100	100	100	100	100%
17	Hermes 3 405B	$0.0000	18.6s	100%	100	100	100	100	100	100%
26	GPT-4o, Aug. 6th (temp=1)	$0.0060	6.9s	100%	100	100	100	100	100	100%
75	GPT-5 Nano	$0.0028	1.2m	100%	100	100	100	100	100	100%
24	GPT-4o, Aug. 6th (temp=0)	$0.0053	5.5s	100%	100	100	100	100	100	100%
9	GPT-5.4 Mini	$0.0022	2.5s	100%	100	100	100	100	100	100%
33	Mistral Large 2	$0.0041	18.9s	100%	100	100	100	100	100	100%
20	DeepSeek V3.1	$0.0008	17.3s	100%	100	100	100	100	100	100%
80	DeepSeek V3.2	$0.0005	1.4m	100%	100	100	100	100	100	100%
16	Gemini 2.5 Flash	$0.0026	6.1s	100%	100	100	100	100	100	100%
2	Inception Mercury	$0.0002	1.7s	100%	100	100	100	100	100	100%
12	GPT-5.4 Nano (Reasoning, Low)	$0.0017	6.7s	100%	100	100	100	100	100	100%
4	GPT-4o Mini (temp=1)	$0.0003	4.4s	100%	100	100	100	100	100	100%
6	Grok 4.3	$0.0010	4.5s	100%	100	100	100	100	100	100%
10	Mistral Small 3.2 24B	$0.0003	9.5s	100%	100	100	100	100	100	100%
5	GPT-4o Mini (temp=0)	$0.0002	4.6s	100%	100	100	100	100	100	100%
63	GPT-5.4 (Reasoning, Low)	$0.013	17.3s	99%	100	100	100	100	98	100%
15	GPT-5.4 Nano (Reasoning)	$0.0015	5.8s	98%	100	100	100	100	98	100%
123	GPT-5	$0.038	1.2m	98%	100	100	100	100	98	99%
82	GPT-5.2	$0.018	27.1s	97%	100	100	99	99	98	99%
106	GPT-5.1	$0.029	52.6s	97%	100	100	100	99	97	99%
101	Claude Sonnet 4.6 (Reasoning)	$0.027	34.0s	96%	100	100	100	100	95	99%
42	Z.AI GLM 5 Turbo	$0.0040	18.6s	96%	100	100	100	100	95	99%
34	Stealth: Hunter Alpha	$0.0000	24.0s	96%	100	100	100	100	95	99%
99	Gemini 3 Pro (Preview)	$0.027	23.0s	96%	100	100	100	100	95	99%
98	Gemini 2.5 Pro	$0.026	24.9s	96%	100	100	100	100	95	99%
70	Qwen 3.6 35B	$0.0060	41.8s	96%	100	100	100	100	94	99%
69	GPT-5.4	$0.013	19.1s	96%	100	100	100	99	95	99%
86	Qwen 3.5 9B	$0.0009	1.4m	95%	100	100	100	100	94	99%
59	Z.AI GLM 5.1	$0.0047	32.1s	95%	100	100	100	100	93	99%
76	Claude Opus 4.5	$0.016	13.7s	94%	100	100	100	100	93	99%
78	Qwen 3.5 122B	$0.012	29.9s	96%	100	100	100	96	96	99%
41	MiniMax M2.5	$0.0022	23.4s	96%	100	100	100	97	96	99%
25	DeepSeek V4 Flash (Reasoning)	$0.0003	12.1s	94%	100	100	100	100	92	98%
30	Grok 4.20	$0.0020	10.3s	94%	100	100	100	100	92	98%
43	GPT-OSS 120B	$0.0004	27.5s	93%	100	100	100	100	92	98%
31	Z.AI GLM 4.5	$0.0013	11.8s	93%	100	100	100	100	92	98%
40	Nemotron 3 Super	$0.0000	24.3s	93%	100	100	100	100	92	98%
29	Grok 4.20 (Beta)	$0.0033	3.0s	93%	100	100	100	100	92	98%
103	GPT-5.5 (Reasoning)	$0.034	22.5s	96%	100	99	98	98	96	98%
19	Inception Mercury 2	$0.0006	1.4s	93%	100	100	100	100	91	98%
28	DeepSeek V4 Flash	$0.0002	11.0s	93%	100	100	100	100	91	98%
96	ByteDance Seed 2.0 Lite	$0.0067	1.3m	92%	100	100	100	100	90	98%
112	ByteDance Seed 2.0 Mini	$0.0023	2.4m	91%	100	100	100	100	89	98%
48	Gemini 2.5 Flash Lite (Reasoning)	$0.0019	23.0s	91%	100	100	100	100	89	98%
57	Gemma 3 12B	$0.0002	37.4s	91%	100	100	100	100	89	98%
71	Claude 3.7 Sonnet	$0.013	15.9s	95%	100	100	100	95	94	98%
115	GPT-5.5 (Reasoning, Low)	$0.040	21.0s	95%	99	98	97	97	97	98%
50	MiniMax M2.7	$0.0014	28.7s	93%	100	100	98	96	94	98%
58	Claude Sonnet 4	$0.0087	10.9s	93%	100	100	100	94	92	97%
36	ByteDance Seed 1.6 Flash	$0.0006	12.8s	92%	100	100	100	93	92	97%
111	GPT-5.5	$0.038	25.7s	95%	98	98	97	97	95	97%
52	Grok 4.1 Fast	$0.0005	15.7s	84%	100	100	100	100	80	96%
45	Grok 4 Fast	$0.0006	7.7s	84%	100	100	100	100	80	96%
66	Claude 3.5 Sonnet	$0.0084	15.1s	89%	100	100	100	92	87	96%
55	Mistral Large 3	$0.0015	18.9s	87%	100	100	100	93	83	95%
65	Gemini 2.5 Flash (Reasoning)	$0.0062	12.4s	86%	100	100	95	91	89	95%
81	Xiaomi MIMO v2.5 Pro	$0.0042	25.8s	79%	100	100	100	100	74	95%
51	Gemini 2.5 Flash Lite	$0.0005	4.7s	81%	100	100	92	90	86	93%
68	Claude Haiku 4.5	$0.0036	7.7s	79%	100	100	94	93	78	93%
100	Qwen 3.5 35B	$0.0089	37.0s	74%	100	100	100	95	67	92%
135	Claude Opus 4	$0.049	26.6s	86%	94	93	92	92	85	91%
84	GPT-4.1 Nano	$0.0001	4.6s	60%	100	100	100	100	50	90%
72	Gemma 3 27B	$0.0002	26.2s	85%	93	93	92	86	85	90%
83	Hermes 3 70B	$0.0003	14.9s	68%	100	100	100	91	58	90%
92	Qwen 2.5 72B	$0.0004	18.7s	63%	100	100	100	94	53	89%
97	Mistral Large	$0.0032	10.4s	57%	100	100	100	100	46	89%
138	Qwen 3.6 27B	$0.023	1.9m	68%	100	100	94	88	64	89%
88	Llama 3.1 70B	$0.0007	19.3s	70%	100	100	93	83	67	89%
93	Nemotron 3 Nano	$0.0002	9.4s	61%	100	100	100	83	50	87%
95	LFM2 24B	$0.0001	11.7s	60%	100	100	100	73	50	85%
105	Cohere Command R+ (Aug. 2024)	$0.0054	12.3s	53%	100	100	78	70	60	82%
130	GPT-4o, May 13th (temp=1)	$0.0094	9.5s	20%	100	100	100	100	0	80%
124	DeepSeek V3 (2024-12-26)	$0.0007	21.2s	20%	100	100	100	100	0	80%
133	Qwen 3 32B	$0.0006	50.4s	20%	100	100	100	100	0	80%
117	Mistral NeMO	$0.0001	4.5s	20%	100	100	100	100	0	80%
120	GPT-5.4 Nano	$0.0017	6.7s	21%	100	100	100	97	0	79%
134	DeepSeek V4 Pro	$0.0025	45.2s	21%	100	100	100	93	0	79%
104	Claude 3 Haiku	$0.0005	3.5s	46%	100	100	100	50	40	78%
121	Z.AI GLM 4.7 Flash	$0.0012	49.5s	46%	100	100	95	50	43	78%
119	Ministral 3 8B	$0.0002	6.8s	22%	100	100	100	86	0	77%
125	Stealth: Healer Alpha	$0.0000	25.5s	22%	100	100	100	81	0	76%
127	Mistral Small 4 (Reasoning)	$0.0014	18.6s	23%	100	100	100	73	0	75%
116	Arcee AI: Trinity Large (Preview)	$0.0000	11.5s	36%	100	100	64	58	50	74%
122	Llama 3.1 8B	$0.0002	7.9s	22%	100	97	88	83	0	74%
109	Ministral 3B	$0.0000	2.9s	42%	100	86	64	57	56	73%
126	Gemma 3 4B	$0.0001	13.3s	22%	100	100	85	73	0	71%
128	WizardLM 2 8x22b	$0.0007	13.8s	21%	100	100	100	56	0	71%
131	Llama 3.1 Nemotron 70B	$0.0003	22.6s	20%	100	100	100	50	0	70%
132	Ministral 8B	$0.0001	6.8s	19%	100	91	64	54	0	62%
141	Qwen3 235B A22B Instruct 2507	$0.0005	26.0s	2%	100	100	100	0	0	60%
142	Writer: Palmyra X5	$0.0053	15.9s	2%	100	100	100	0	0	60%
136	Arcee AI: Trinity Mini	$0.0002	7.8s	2%	100	100	100	0	0	60%
140	DeepSeek V3 (2025-03-24)	$0.0005	15.3s	5%	100	100	89	0	0	58%
139	Mistral Small 4	$0.0005	6.4s	16%	85	81	71	0	0	47%
146	Ministral 3 3B	$0.0001	2.8s	0%	100	93	0	0	0	39%
143	Mistral Small Creative	$0.0003	6.2s	15%	92	50	50	0	0	38%
145	Rocinante 12B	$0.0003	18.8s	16%	71	70	43	0	0	37%
144	Mistral Medium 3.1	$0.0019	13.3s	26%	50	50	50	0	0	30%
147	Ministral 3 14B	$0.0003	8.3s	0%	100	50	0	0	0	30%
91.70%

Language Writing

Character dialogue (Italian) in a story

Performance Score Distribution (Top 20)

Price-Performance Score Distribution (Top 20)

Most Stable Models (Top 20)

Top Overall Models (Top 20)