作者文章归档:闫英飞

请简要介绍您的职业履历

必贝yo告诉你如何了解爬取大规模数据


 

必贝yo告诉你如何了解爬取大规模数据

如果你仔细观察,就不难发现,懂爬虫、学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这样的编程语言提供越来越多的优秀工具,让爬虫变得简单、容易上手。

 

爬虫是入门Python最好的方式,没有之一。Python有很多应用的方向,比如后台开发、web开发、科学计算等等,但爬虫对于初学者而言更友好,原理简单,几行代码就能实现基本的爬虫,学习的过程更加平滑,你能体会更大的成就感。

掌握基本的爬虫后,你再去学习Python数据分析、web开发甚至机器学习,都会更得心应手。因为这个过程中,...

Read more

必贝yo教你看懂大数据


 必贝yo教你看懂大数据

近年来,大数据这个词的热度很高,受到公众的广泛关注。

对于很多人来说,当他第一次听到“大数据”这个词,会自然而然从字面上去理解——认为大数据就是大量的数据,大数据技术就是大量数据的存储技术。

但事实上,它并不只是一项存储技术,而是一系列和海量数据相关的抽取、集成、管理、分析、解释技术。大数据系统,是一个庞大的框架系统。

更进一步来说,大数据是一种全新的思维方式和商业模式。

数据的来源

 

数据的增长,为什么会如此之快?

说到这里,就要回顾一下人类社会数据产生的几个重要阶段。

大...

Read more

必贝yo告诉你深度学习训练和推理之间有什么差异?


 

必贝yo告诉你深度学习训练和推理之间有什么差异?

推理是在深入学习训练中所学到的并会投入使用的地方。

没有训练就不会有推理。可以理解,这就是我们在大多数情况下获得并使用知识的方式。就像我们不能拉着我们所有的老师、一些超载的书架以及红砖校园来阅读莎士比亚的十四行诗一样,推理并不需要其训练方案的所有基础设施来做好它的工作。

因此,让我们分解推理从训练到推理的过程,以及在人工智能的大背景下应该如何发挥作用。

训练深度神经网络

 

虽然我们的目标是一致的——知识——神经网络的教育过程或训练(谢天谢地)并不像我们...

Read more

必贝yo告诉你大数据时代的便利与负担


 

必贝yo告诉你大数据时代的便利与负担

 

大数据时代下,巨量的数据充斥着我们的生活。大数据的利用在一定程度上给我们的生活增添了便利,但也有人会说在大数据时代,巨大的数据量让我们生活更加辛苦。大数据指不能做到精确处理,只能给出一个大概预测的全体数据。大数据时代,人们运用大量数据分析问题的时代,具有数据量大、类型繁多、价值密度低、速度快时效高等特点,不同于信息时代。具体区别为,大数据时代的数据量远超信息时代,且大数据时代更注重相关关系的判断,而信息时代则侧重因果关系。其实与之前的时代相比,大数据时代在一定程度上为我们的生活添加了更多的负担。

首先,信息管理更困...

Read more

必贝yo告诉你如何构建实时智能异常检测平台?


 

必贝yo告诉你如何构建实时智能异常检测平台?

1.前言

随着互联网的迅速发展,各个公司都建立了自己的监控体系,用于提前发现问题降低损失,携程亦是如此。然而携程的监控体系存在以下三个问题:

§ 监控系统繁多

§ 监控告警配置复杂

§ 没有统一规范

首先携程目前光公司级别的监控系统就有三套,各个 BU 为了满足自己的业务监控需求也陆续开发了许多自己的监控系统。其次这些监控系统都是基于规则来判断是否存在异常,比如当满足同环比连续几个点上升或下降到用户配置的阈值时触发告警。最后是没有统一的规范,这里指的是两个...

Read more

必贝yo告诉你为什么面部识别系统识别深色人脸时出错率更高


 

必贝yo告诉你为什么面部识别系统识别深色人脸时出错率更高

面部识别系统流行于九十年代早期,当时美国国防部希望发明一种可以发现偷渡边境的不法分子的识别技术,为此投入了大量研究。为此,美国国防部为著名的大学科学家和面部识别领域的专家提供了研究经费。为此,美国国防部为著名的大学科学家和面部识别领域的专家提供了研究经费

2001年初,在坦帕(Tampa)举行的第35届超级碗(Super Bowl)比赛中,执法部门首次在公共场所使用面部识别技术,在数千名观众中搜寻罪犯和恐怖分子。不久之后,美国的其他敏感地区也安装了面部识别系统,以跟踪犯罪活动。

然而,美国政府的研究却表明,即...

Read more

必贝yo告诉你大数据开发是做什么的


 

必贝yo告诉你大数据开发是做什么的

大数据开发工程师,所学习的知识是做什么的

今天我们来看看大数据开发需要了解的一些知识。

1、linux

大数据集群主要建立在linux操作系统上,Linux是一套免费使用和自由传播的类Unix操作系统。而这部分的内容是大家在学习大数据中必须要学习的,只有学好Linux才能在工作中更加的得心应手。

2、Hadoop

我觉的大家听过大数据就一定会听过hadoop。Hadoop是一个能够对大量数据进行离线分布式处理的软件框架,运算时利用mapreduce对数据进行处理。在大数据中的用途,以及快速搭建一个hadoop的实验环境,在本...

Read more

必贝yo告诉你多大的数据叫大数据


 

必贝yo告诉你多大的数据叫大数据?

大数据什么?多大的数据叫大数据?

很多没有接触过大数据的人,都很难清楚地知道,究竟多大的数据量才可以称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。

企业端(B端)数据近十万的级别,就可以称为大数据;个人端(C端)的大数据要达到千万级别。收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据,形成数据服务即可。很有趣,大家可以看到2B和2C,两类大数据差了两个数量级。

有些小公司,数据只有千到万级的规模,但经过收集分析,也能从中有针对性的总结出这一群体的原则,...

Read more

必贝yo·告诉你什么是互联网络


 

互联网

国际互联网就是指因特网。因特网(Internetwork)是一组全球信息资源的总汇。有一种粗略的说法,认为INTERNET是由于许多小的网络(子网)互联而成的一个逻辑网,每个子网中连接着若干台计算机(主机)。 Internet以相互交流信息资源为目的,基于一些共同的协议,并通过许多路由器和公共互联网而成,它是一个信息资源和资源共享的集合。

 

定义

国际互联网络,即为因特网(Internet),是目前世界上最大的计算机互联网络,它是由那些使用公用语言互相通信的计算机连接而成的全球网络,一旦你连接到它的任何一个节点上,就意味着您的计算机已经联入In...

Read more

必贝yo告诉你大数据在现代企业财务管理中能够发挥什么作用


 必贝yo告诉你大数据在现代企业财务管理中能够发挥什么作用

1 大数据时代的到来给企业财务带来了机遇,企业应当与时俱进,探索完善、健全的发展目标,利用科学合理的数据为当前和未来的发展前景做出分析和规划,企业的财务管理要善于利用大数据技术带来的强大助力,让企业的财务管理工作更加科学、先进和高效。通过对财务管理意识的转变,不断完善企业财务管理模式,并加快财务管理信息化的脚步,培养出适应大数据时代的财务管理人才,促进企业健康快速地成长,同时为国家的经济发展做出重要贡献。

 

2 大数据技术的应用为企业财务部门财务分析提供便利

应用大数据技术之后,...

Read more