机器学习评估指标

引言

在机器学习中,我们需要评估模型的好坏,初学时,会认为有准确率就可以了,即模型作出正确的判断次数除以总的测试次数,公式化为:\(corret\_times/total\_times\)。但这种方式并不合理,试想有100个被试,其中1人感染疾病,其余99人正常,如果模型设置为不管任何输入,输出都正常,则这个模型的准确率就能达到99%了,按上面公式来看,这个无用的模型貌似ok。

实际上,机器学习有很多约定俗成的评估指标,最常用的就是精确率(precision),召回率(recall),F1值,以及ROC,AUC。其中AUC指标往往作为推荐系统排序的指标。

本文主要介绍混淆矩阵,以及上述指标的基本概念。这部分概念非常基础,资料很多,但往往又比较容易搞混,所以我尝试在合理的地方举一些例子说明,避免混淆概念。

继续阅读“机器学习评估指标”

在wordpress中添加公式

因为后面博客想介绍机器学习相关的东西,所以会引入一些公式。通过查阅资料,发现是比较容易实现的。主要有以下步骤:

  • 修改对应主题的header.php;
  • latex验证网站上验证以下自己公式;
  • 验证好后贴到自己的博文里面,就ok了,ok了,好简单。

具体请参见这篇文章:http://www.fanyeong.com/2017/07/21/wordpress-how-to-display-equation/,或者google以下都可以,下面说以下步骤

继续阅读“在wordpress中添加公式”

个人网站搭建

描述个人建站的步骤与日常小技巧

网站建站主要分为以下几个步骤:

  1. 准备服务器:一般可以选择阿里云等(手机注册,找回密码很方便);
  2. 申请网站域名:可以在阿里云上一站解决,也可以用godaddy等来完成;
  3. 备案:如果是申请cn域名,需要备案,这个一般在阿里云对应入口,填写个人有效信息即可;
  4. 搭建网站:备案一般需要等一个星期左右,中间这段时间就可以搭建网站了(当然也可以延后,没关系),貌似现在都用wordpress来搭建;
  5. 网站记得填写备案号
  6. 关联域名:在dns上关联服务器IP地址与域名地址

前面3步,我这里都用阿里云上相关的部分完成申请,一站式申请还是非常方便的。这里重点讲一下4,5步的事情。

继续阅读“个人网站搭建”

开篇👊😄

从事互联网行业已经11年了,前5年专注于底层开发,包括socket编程,POSIX以及分布式文件系统(Taobao FS)。尤其是TFS引入,解决了当时公司百亿/PB级别小文件存储难题,得到公司的认可。
当解决掉数据存储问题后,一直思考如何挖掘数据后面的价值,刚好以Hadoop/Yarn为基础的大数据宣传甚猛,所以后来转战HDFS,MR,HBASE,Spark等组件,并与团队一起解决了每天千亿记录,PB级别数据的存储与处理(偏OLAP分析)。当时认为OLAP我已经到一定瓶颈,又想继续深入挖掘数据,所以转到机器学习/深度学习的方向上来,继续奋斗……
一路以来,一直在学习与应用中不断转换,之前也有在CSDN写过一些东西(当更多是在公司文档中),突然有一天,感觉互联网的某个地址里面,记录一下自己的学习心得、使用经验是很酷的事情,所以搞了个博客,希望以后有机会记录下学习/工作的酸甜苦辣,与素未谋面的人一起分享,如果能与读者技术上有一些思路的共鸣,甚至启迪,那将是我非常开心的事情。