MYOAK博客 | 关注数据科学和算法编程的个人博客
数据科学

机器学习——经验积累的无比重要性(未完)

MYOAK 3355

通过最近一段机器学习任务的上手,感觉到做机器学习更像是当医生,很需要知识储备和经验累积。对于小白来说面对一堆数据,甚至有时候数据都需要自己想办法获取,毫无头绪,根本无从下手。即使有很多写好的框架,但是胡乱地套进去,会遇到很多预想不到的问题。不知道问题源自何处,如何解决。这就需要在学习理论知识的同时(对各种算法模型的了...

MYOAK博客 | 关注数据科学和算法编程的个人博客
数据科学

机器学习笔记——Custom Transformers

MYOAK 1249

对于特定的机器学习的任务,我们常常需要自己定义transformer,比如清理数据或者合并特定的attributes。在使用Scikit-Learn时,最好的方法是可以和Scikit-Learn的其他功能无缝连接,比如可以使你的自定义transformer在pipeline里面使用。所以你只需要自定义一个具有fit()...