模型评估综述

firstboy05132017-11-09 21:10:22自然语言处理 / 机器学习
模型评估综述,作为机器学习平台,这些是需要提供出来的,TODO mark下,比如: Accuracy Recall F-Score Area Under Roc (AUC) Logarithmic Loss (LogLoss) Mean Absolute Error (MAE) Root Mean Squared Error (RMSE) …&

好的平台一般都会有好的内容来支撑

firstboy05132017-09-02 23:52:35比咕视角 / 宏观视角
刚才了解了下各在线编辑器,写文章用的,试用了知乎、简书、Lofter、十五言。都有自己的缺陷,我试用下来的感觉是按这个顺序,除了Lofter基本没人用之外,产品风格比较旧外,其他几个基本越知名的编辑体验越比不上不知道的,比如知乎、简书、十五言的顺序。 对于我自认为十五言比较好用,那只限于字体比较好看而已。突然想到,好的工具某种程度上也是一种内容。比如就冲着字体好,会有一波用户过来使用。

短视频的江湖——初识网络视频

firstboy05132017-09-02 21:55:26比咕视角 / 业内观点
一、初识短视频领域 要说短视频的江湖,我想从最开始接触短视频的想法开始。 在我就读大学的时候,流量还不是很够,大家看视频还倾向于下载下来看,那个时候U盘、移动硬盘很吃香,我记得大一的时候,当时实验室的机器还支持软盘,就是默认电脑里面为什么没有B盘的那个,那个时候已经很难买到软盘了,1.44M,哈哈,当时有个课程要求大家买软盘然后把作业数据写进去,回想起来这软盘老师收了去真的会一个个去检

是时候有一个不一样的开始了

firstboy05132017-09-02 21:36:17比咕视角 / 每日一文
比咕网,这个4年前在上海的时候,我自己创办的一个博客网站,到后来很长一段时间,我都没有任何更新。 生活和工作也逐渐颓废下来,没有再像之前那样有一个明确的野心和战斗力去做自己曾经的梦想。 这个编辑器还遗留了一些问题,虽然代码从头开始都是自己写出来的,但待优化的问题多多,而且时至今日,在众多便捷的online编辑器面前,比咕网显得那么老旧土气,关键是作者只有我自己,就像自己给自己演戏一样,

Matlab R2013a for Mac安装小记

firstboy05132016-03-09 14:50:21程序技巧 / 辅助工具
下载了Matlab R2013a for Mac安装的时候,因为我用的是OSX Yosemite 10.10版本,这里遇到两个小问题简述一下。 1. 一个是需要指定本地javadir。 在mount安装的iso文件后(我双击默认放的路径是/Volumes/MATLAB_801 R2013/),发现去点击里面的InstallForMacOSX.app启动起来一会儿就又消失了,也没有报错信

Mac中的Numbers两个小技能Get it

firstboy05132015-12-17 12:21:50程序技巧 / 辅助工具
1. 每一行的最右边都对左边数据进行相同的公式计算, 每行不需要复制公式,拖拽选中单元格侧边中间的黄色圆点就可以快速复制公式。 2. 直接「⌘C」「⌘V」同样可以完成公式的复制和粘贴,如果只想粘贴结果而不是公式按「⇧⌘V」。

网站所在服务器因redis漏洞在9月份被黑,无奈回滚~

firstboy05132015-12-10 23:18:36比咕视角 / 每日一文
已发现恶意某个perl脚本,因为服务器还涉及一些其他数据的安全考虑,特此含泪回滚到一个靠前时刻的快照…… 后面会统一整理博客及改版事宜~

自然语言处理&搜索引擎中一些系统模块演示示例

firstboy05132014-05-23 09:39:58比咕实验室 / 互联网项目
以前做过的一些底层系统模块我做了一些演示版本,下面是演示地址: CWS (Chinese Word Segmentation) 简体中文分词系统示例 http://115.28.173.63/cws/cws.html massword海量数据新词自动识别示例 http://115.28.173.63/mass/mass.html 什么是deduplication去重? ht

海量文档快速语义去重

firstboy05132014-03-25 09:56:38搜索引擎 / 搜索功能
本文的实现思路是结合Charikar的simhash指纹编码与Google的Hamming distance拆分算法原理实现的。 说起这个实现,还是先说说需求吧。搜索引擎中常常要对新进来的文档(一般指网页,这里统一以文档称之)进行重复性判断,判断这个文档是否已经在已有数据库中存在了没有,如果存在则不予插入。这也就是通用互联网搜索引擎对整个互联网的网页进行不间断更新的处理过程,当然这个不间断的间隔

搜索引擎相似度计算方法之arctan方法

firstboy05132014-03-24 17:56:11搜索引擎 / 搜索功能
搜索引擎相似度的计算有很多种方法,相似度是对搜索结果进行排序的一种方式,是指所输入的搜索关键字与搜索结果每一条记录之间的"相似程度",我们知道百度的竞价排名就是一种"有名"的相似度排名方法,这里使用arctan函数来计算不同次数相邻关键字的相似度计算,仅仅在于获取不同关键字出现次数以达到完全分隔在不同相似度等级分数的需求。在搜索引擎的设计与实现中,除了存储速
比咕搜索引擎定制与数据分析技术服务
最新评论
比咕网移动端APP下载

iPhone、Android 手机
扫描二维码下载安装

(可以使用QQ,微博等的扫描二维码功能)