Alpaca-eval

Latest version: v0.6.2

Safety actively analyzes 623368 Python packages for vulnerabilities to keep your Python projects secure.

Page 1 of 6

0.6.2

What's Changed
* [BUG] backward compatibility with AF by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/278
* Add Nanbeige-Plus-Chat-v0.1 to AlpacaEval by yuani114 in https://github.com/tatsu-lab/alpaca_eval/pull/279
* Update README.md by Dominic789654 in https://github.com/tatsu-lab/alpaca_eval/pull/280
* [BUG] revert to GPT4 preview 1106 by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/283
* Add support for analyzing evaluators with custom cross-annotations by rdnfn in https://github.com/tatsu-lab/alpaca_eval/pull/281
* [ENH] llama3 by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/285

New Contributors
* Dominic789654 made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/280
* rdnfn made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/281

**Full Changelog**: https://github.com/tatsu-lab/alpaca_eval/compare/v0.6.1...v0.6.2

0.6.1

What's Changed
* Add Aligner-2B+Qwen1.5-72B-Chat & Aligner-2B+Claude3 Opus to AlpacaEval by AlignInc in https://github.com/tatsu-lab/alpaca_eval/pull/259
* Supplement for Aligner by AlignInc in https://github.com/tatsu-lab/alpaca_eval/pull/261
* Add Ein-70B-v0.1 to AlpacaEval by bin-bi in https://github.com/tatsu-lab/alpaca_eval/pull/262
* Add TempNet-LLaMA2-Chat to AlpacaEval by xumao-nju in https://github.com/tatsu-lab/alpaca_eval/pull/264
* Add Conifer-7B-DPO to AlpacaEval by liulixin29 in https://github.com/tatsu-lab/alpaca_eval/pull/267
* Updating link to a super fast demo! by kyleliang919 in https://github.com/tatsu-lab/alpaca_eval/pull/268
* Add Nanbeige2-8B-Chat to AlpacaEval by yuani114 in https://github.com/tatsu-lab/alpaca_eval/pull/274
* [ENH] adding drbx and gpt4 turbo by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/275

New Contributors
* AlignInc made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/259
* bin-bi made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/262
* xumao-nju made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/264
* liulixin29 made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/267
* yuani114 made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/274

**Full Changelog**: https://github.com/tatsu-lab/alpaca_eval/compare/v0.6...v0.6.1

0.6

What's Changed
* [DATA] Add Gemma by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/242
* [NOTEBOOK] adding final length correction notebook. by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/244
* add Mistral-7B-ReMax-v0.1 by liziniu in https://github.com/tatsu-lab/alpaca_eval/pull/245
* [ENH] add claude 3 by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/247
* [ENH] add contextual by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/250
* [ENH] add mistral large by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/251
* Add Samba-CoE-v0.2 to AlpacaEval by kyleliang919 in https://github.com/tatsu-lab/alpaca_eval/pull/253
* Add Samba-CoE-v0.2-best-of-16 to AlpacaEval by kyleliang919 in https://github.com/tatsu-lab/alpaca_eval/pull/256
* Add Mistral-ORPO-Beta to AlpacaEval by jiwooya1000 in https://github.com/tatsu-lab/alpaca_eval/pull/257
* Yann/length correction by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/258

New Contributors
* liziniu made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/245
* kyleliang919 made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/253
* jiwooya1000 made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/257

**Full Changelog**: https://github.com/tatsu-lab/alpaca_eval/compare/v0.5.4...v0.6

0.5.4

What's Changed
* Add Qwen1.5-72B-Chat to AlpacaEval by Lukeming-tsinghua in https://github.com/tatsu-lab/alpaca_eval/pull/226
* Add claude-instant-1.2, deepseek-llm-67b-chat, wizardlm-70b, Qwen-14B-Chat (config + outputs without annotations) by gblazex in https://github.com/tatsu-lab/alpaca_eval/pull/228
* [DATA] Adding annotations for the arena models by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/229
* Update README.md - Add missing "Y" to "ou" by yoderj in https://github.com/tatsu-lab/alpaca_eval/pull/230
* [DEV] Analyzing length-controlled metrics. by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/231
* [DOC] add annotation interpretation by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/232
* [DATA] add results from the Arena openai models by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/234
* update ELO for llama-2-13b-chat-hf by gblazex in https://github.com/tatsu-lab/alpaca_eval/pull/235
* [NOTEBOOK] add length-corrected GLM by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/237
* [ENH] add inverse mapper to make sure in and out types are the same by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/240
* [ENH] update to allow AF to use AE by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/241

New Contributors
* Lukeming-tsinghua made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/226
* yoderj made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/230

**Full Changelog**: https://github.com/tatsu-lab/alpaca_eval/compare/v0.5.3...v0.5.4

0.5.3

What's Changed
* [ENH] add mistral-medium by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/205
* [ENH] add internlm2-chat-20b-ppo by C1rN09 in https://github.com/tatsu-lab/alpaca_eval/pull/207
* prettify "pretty_name" of internlm2 by C1rN09 in https://github.com/tatsu-lab/alpaca_eval/pull/208
* [ENH] add outputs & configs form dolphin 2.2.1 by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/209
* Add PairRM 0.4B + Yi-34B-Chat to AlpacaEval 2.0 by jdf-prog in https://github.com/tatsu-lab/alpaca_eval/pull/210
* dolphin 2.1.1 configs.yaml by gblazex in https://github.com/tatsu-lab/alpaca_eval/pull/212
* Update README.md (small typo) by xwinxu in https://github.com/tatsu-lab/alpaca_eval/pull/213
* [TEST]: fix ordering of df by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/214
* Add Snorkel-Mistral-PairRM-DPO (best-of-16) to Alpaca Eval 2.0 by viethoangtranduong in https://github.com/tatsu-lab/alpaca_eval/pull/215
* update InternLM2 chat template by C1rN09 in https://github.com/tatsu-lab/alpaca_eval/pull/216
* Add Starling-LM-7B-alpha, vicuna-13b-v1.5, vicuna-7b-v1.5 to AlpacaEval (config + outputs without annotations) by gblazex in https://github.com/tatsu-lab/alpaca_eval/pull/217
* [RES] add 3 models for arena correlations by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/218
* Add xwinlm-70b-v0.3 to AlpacaEval by nbl97 in https://github.com/tatsu-lab/alpaca_eval/pull/221
* [ENH] add referenced_models locally by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/224

New Contributors
* C1rN09 made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/207
* gblazex made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/212
* xwinxu made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/213
* viethoangtranduong made their first contribution in https://github.com/tatsu-lab/alpaca_eval/pull/215

**Full Changelog**: https://github.com/tatsu-lab/alpaca_eval/compare/v0.5.2...v0.5.3

0.5.2

What's Changed
* [BUG] force openai >1.5.0 by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/202
* [WIP] precompute all leaderboard for AE2 by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/199
* [ENH] add OpenHermes by YannDubs in https://github.com/tatsu-lab/alpaca_eval/pull/203

**Full Changelog**: https://github.com/tatsu-lab/alpaca_eval/compare/v0.5.1...v0.5.2

Page 1 of 6

Releases

Has known vulnerabilities

Alpaca-eval

Page 1 of 6

0.6.2

0.6.1

0.6

0.5.4

0.5.3

0.5.2

Page 1 of 6

Links

Releases