Passer au contenu principal

Phi-3.5-mini-instruct

MicrosoftPhiOpen WeightMIT · Commercial OK

Description

Phi-3.5-mini-instruct is a 3.8B-parameter model that supports up to 128K context tokens, with improved multilingual capabilities across over 20 languages. It underwent additional training and safety post-training to enhance instruction-following, reasoning, math, and code generation. Ideal for environments with memory or latency constraints, it uses an MIT license.

Date de sortie
2024-08-23
Paramètres
3.8B
Longueur du contexte
Modalités
text

Radar de capacités

60
general
60
coding
60
reasoning
26
scienceest.
0
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Reasoning51
69.0
LS

Scores de benchmarks (LLM Stats)

Biology

GPQA30.4%Aut.

Code

RepoQA77.0%Aut.
HumanEval62.8%Aut.

Creativity

Social IQa74.7%Aut.
Arena Hard37.0%Aut.

Finance

MMLU69.0%Aut.
TruthfulQA64.0%Aut.
MMLU-Pro47.4%Aut.

General

ARC-C84.6%Aut.
PIQA81.0%Aut.
OpenBookQA79.2%Aut.
MBPP0.70 / 100Aut.
MMMLU55.4%Aut.

Language

BoolQ78.0%Aut.
MEGA XStoryCloze73.5%Aut.
BIG-Bench Hard69.0%Aut.
Winogrande68.5%Aut.
MEGA XCOPA63.1%Aut.
MEGA TyDi QA62.2%Aut.
MEGA MLQA61.7%Aut.
MEGA UDPOS46.5%Aut.
SQuALITY24.3%Aut.

Long Context

RULER84.1%Aut.
Qasper41.9%Aut.
GovReport25.9%Aut.
QMSum21.3%Aut.
SummScreenFD16.0%Aut.

Math

GSM8k86.2%Aut.
MATH48.5%Aut.
MGSM47.9%Aut.

Reasoning

HellaSwag69.4%Aut.

Indices d'évaluation AA

Aucune donnée d'évaluation AA disponible

Scores par catégorie LLM Stats

Psychology
70
Reasoning
70
Code
60
Creativity
60
Finance
60
General
60
Healthcare
60
Language
60
Legal
60
Math
60
Physics
60
Long Context
50
Writing
40
Biology
30
Chemistry
30
Summarization
20

Tarification

Aucune donnée de prix disponible

Vitesse

Aucune donnée de vitesse disponible

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes