机器学习笔记

分类

准确率:所有样本中预测正确的占比

精确率:预测为正的样本中真正的正样本占比

召回率:正样本中预测为正的占比

F1:精确率和召回率的调和均值

F-score:

P N
P’ TP FP
N’ FN TN

序列

BLEU(Bilingual Evaluation understudy)

惩罚因子BP(Brevity Penalty)

机器翻译

ROUGE(Recall-Oriented Understudy for Gisting Evaluation)

ROUGE-N 基于N-gram公现性统计
ROUGE-L 基于最长公有子句共现性精确度和召回率Fmeasure统计
ROUGE-W 代权重的最长公有子句共现性精确度和召回率Fmeasure统计
ROUGE-S 不连续二元组共现性精确度和召回率Fmeasure统计

ROUGE-N

ROUGE-L

最长公共子句longest common subsequence(LCS)