메인 콘텐츠로 건너뛰기

Phi-3.5-mini-instruct

MicrosoftPhiOpen WeightMIT · Commercial OK

설명

Phi-3.5-mini-instruct is a 3.8B-parameter model that supports up to 128K context tokens, with improved multilingual capabilities across over 20 languages. It underwent additional training and safety post-training to enhance instruction-following, reasoning, math, and code generation. Ideal for environments with memory or latency constraints, it uses an MIT license.

출시일
2024-08-23
파라미터
3.8B
컨텍스트 길이
모달리티
text

능력 레이더

60
general
60
coding
60
reasoning
26
science추정
0
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Reasoning51
69.0
LS

벤치마크 점수 (LLM Stats)

Biology

GPQA30.4%자체 보고

Code

RepoQA77.0%자체 보고
HumanEval62.8%자체 보고

Creativity

Social IQa74.7%자체 보고
Arena Hard37.0%자체 보고

Finance

MMLU69.0%자체 보고
TruthfulQA64.0%자체 보고
MMLU-Pro47.4%자체 보고

General

ARC-C84.6%자체 보고
PIQA81.0%자체 보고
OpenBookQA79.2%자체 보고
MBPP0.70 / 100자체 보고
MMMLU55.4%자체 보고

Language

BoolQ78.0%자체 보고
MEGA XStoryCloze73.5%자체 보고
BIG-Bench Hard69.0%자체 보고
Winogrande68.5%자체 보고
MEGA XCOPA63.1%자체 보고
MEGA TyDi QA62.2%자체 보고
MEGA MLQA61.7%자체 보고
MEGA UDPOS46.5%자체 보고
SQuALITY24.3%자체 보고

Long Context

RULER84.1%자체 보고
Qasper41.9%자체 보고
GovReport25.9%자체 보고
QMSum21.3%자체 보고
SummScreenFD16.0%자체 보고

Math

GSM8k86.2%자체 보고
MATH48.5%자체 보고
MGSM47.9%자체 보고

Reasoning

HellaSwag69.4%자체 보고

AA 평가 지수

AA 평가 데이터가 없습니다

LLM Stats 카테고리 점수

Psychology
70
Reasoning
70
Code
60
Creativity
60
Finance
60
General
60
Healthcare
60
Language
60
Legal
60
Math
60
Physics
60
Long Context
50
Writing
40
Biology
30
Chemistry
30
Summarization
20

가격

가격 데이터가 없습니다

속도

속도 데이터가 없습니다

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크