航拍武汉动车段动车组蓄势待发

2020年1月18日 0 Comments

1月9日凌晨,在武汉动车段经过检修、保温作业的动车组蓄势待发,迎接即将开始的2020年春运。 中新社记者 郑子颜 摄

中新网12月10日电 据日媒报道,当地时间10日早上,日本温泉胜地箱根出现3头野猪,据周边居民表示,最近该地经常有野猪出现,12月还有人看到过3头野猪在餐厅等地翻垃圾桶的情景。

第一有专业搭建场景的实验室,第二我们在华北、华东、华北都有数据标注的基地进行相应的交付。还有一块我们有专业的、拥有自主知识产权的采集系统、标注系统,其中重要的是有全程项目经理跟踪数据交付的流程,保证最后交付的质量。

目前AI应用在行业当中掀起了非常高的浪潮,若我们把AI应用比作成一个学生,那么这些学生的老师就是实现AI应用的算法工程师。但是光靠老师、学生是不够的,他们还需要高质量的教材,而数据就是老师、学生们所使用的教材,我今天跟大家分享的就是教材生产背后的故事:场景数据是人工智能产业突围的关键。

这涉及到人工智能的公平性问题,要求产品要能被所有用户使用——肤色、方言、年龄的多样性都要纳入考虑范围。以机器人听懂人说话的这一需求为例,要求产品不仅要能够识别小孩的声音,同时也要能识别老人的声音,因此需要对相应的不同样本进行数据采集标注。这样一个复杂的工作过程,对人工智能企业服务人员的协同性提出了极大挑战。

作业协同化,在生产制造中,其内部有几十个流程串联起来,像质检、抽检等等,而且参与人员非常多,那么生产流水线如何更好的把控时间节点,怎么进行上下游产业链工作环境的衔接,怎样提高工作效率,这将是非常重要的一点。

比如在医疗环节中,如果问诊机器人可以更成熟化的落地,那么未来医疗人员、医护人员可以将很多精力从重复性的问诊工作中释放出来,他们会有更多时间关心病人精神、心理的相关活动,这是我们认为AI对行业的影响。

2019年对于陈文学来说是特别的一年,在新中国成立70周年之际,他作为先进人物代表被邀请到北京观看庆祝中华人民共和国成立70周年文艺晚会《奋斗吧,中华儿女!》。之后,他还参观了新中国成立70周年的大型展览。“当时,我是流着眼泪观看的,现场特别感人,整台晚会和大型展览反映了我们国家日新月异的变化,经济发展和政治生活各个方面的巨大成就,我看了特别受启发、受教育。”时隔数月回想起来,陈文学仍难掩激动。

同一个自然人,如果没有多个角度的照片做数据的话,整个模型是训练不出来的。这个时候发现需要用一些新的方法才能够采集到单用户多角度的照片,于是众包数据的方式产生了。

此次为了帮助创业者和投资人重新蓄力,2019年,猎云网携全新品牌“新势力(New Force Summit)”亮相。本次峰会由猎云网主办,锐视角、猎云资本、猎云财经、企业管家协办。

陈文学退休之前,是内蒙古北重集团的一名退休工人,50多年来,他坚守初心,不遗余力地学习和宣传雷锋精神;他慷慨解囊,捐款近30万元帮助了数十位困难学生和孤寡老人;他四处奔波募集善款,资助白血病和重度烧伤女孩重获新生;他自制150多块雷锋事迹展板,行程1万多公里300多次,巡展雷锋精神;他走学校,进社区,不仅向人们宣传雷锋精神,还担任了50多所学校校外辅导员,在全市中小学成立雷锋班,让成千上万的人传承和学习雷锋精神……

此外,还有一名该商店街的居民表示,“最近(野猪)真的很多,好像是晚上天黑了才出动”。

据一名拍摄视频的目击者表示,“(野猪)经常早上出来吃剩饭,把饭店的垃圾弄得乱糟糟的很烦人”,他还表示已经购买了击退野猪用的喷雾。

众所周知人工智能应用有三要素:算法、算力、数据。在这里我给大家举个简单的例子说明这个问题:以OCR文字识别引擎为例,文字识别是非常典型的AI应用,其也受约于算法、算力、数据,起初想做印刷数据,算法模型要想将印刷字体识别好需要的CPU、GPU,再用算力将印刷字体跑起来就可以了。

云测数据通过自建基于不同场景的独特数据场景实验室、开展定制化数据采集,同时自建数据标注基地的多道标审流程以确保输出“高质精准”的数据。直击特定场景化下的数据缺失、质量良莠不齐、数据隐私安全性等行业问题,以帮助AI企业打造以高精度数据为核心的行业壁垒。

以上讲的不仅仅是一个行业的发展趋势,对于任何一个想要开始启动AI的研发企业来讲,为了解决自己的AI产品的数据需求,通常企业自身也会经历过这几个阶段。不管是从第几个阶段开始,最后都会落在定制化数据这个阶段上。云测数据为了更好满足定制化数据的需求,我们做了几件事情:

谈到AI数据服务发展的简史,我们认为可归纳为五个阶段:1、互联网沉积数据阶段 2、通用型数据产品 3、众包数据服务 4、定制化数据服务 5、用户数据沉积,这也是AI产品从项目立项、验证、研发、落地、推广使用的生命全周期数据。

Testin云测成立于2011年,为全球超过百万的企业及开发者提供云测试服务、AI数据标注服务、安全服务及推广服务。截止到目前为止,云测数据的数据标注业务已发展超一千人,为智能驾驶、智慧城市、智能家居、智慧金融等领域提供定制化的AI数据服务,全方位支持文本、语音、图像、视频等各类型数据的处理。目前我们在华北、华东、华南都有数据交付中心,很荣幸服务了众多AI相关的企业。

峰会上,Testin云测CTO陈冠诚以《场景数据成为人工智能产业突围关键》为主题分享了自己的观点。AI迅速爆发的背后究竟谁是推手?现下众多巨头企业、初创公司等纷纷入局人工智能领域,都在尝试寻找全新突破口。业内曾流传着这样一句话:得“数据”者,得“人工智能”,而能将“人工智能”玩的转的,便能称的上是翘动世界第四次工业革命的先锋了。

当做完印刷字体的文字识别之后,因为业务发展的需求可能还想加上对自然场景文字的识别,那就要获取更多自然场景的文字数据。另外整个算法模型需要更新换代,不仅是印刷字体的识别、自然场景的文字识别,还会有更多的需求提出。这样模型能力升级了,算力需求也跟着升级了。这是这三要素相互制约,也相互促进的迭代过程的一个简单例子。

大家下午好!我是来自Testin云测的陈冠诚,非常荣幸跟大家分享关于AI话题。

陈文学红色志愿者服务工作室里的每一个物件,都是陈文学用心收集来的。雷锋故事的连环画、小人书,雷锋战友陈广生送给陈文学的书,雷锋生前辅导的7个孩子的亲笔签名,这些与雷锋有关的物件都被他收集到这个70多平方米的工作室里。

定制化数据:多模态、多场景、高精度

人工智能技术的背后有三大支柱:算法、算力和数据,这三者相辅相成、相互制约,其中数据是核心生产资料,只要有了大量优质的数据,再加上算法实现高效的机器运算、算力的推动,AI才能越走越远。没有数据,再多的算力和模型上的投入,也不能让AI实现落地。

在我们服务的众多企业中共分为三大类型:第一类是科技巨头,覆盖的场景广,伴有多种品类的人工智能需求。第二类是新兴的人工智能企业,包含智能驾驶、视觉、语音等相关公司。第三类就是行业巨头,它们会利用AI来对整个行业进行产品升级。

今年陈文学已经85岁高龄,虽然已是耄耋之年,但他没有放慢自己前进的脚步,年终岁末,他已经制定出自己的2020年“工作计划”。“入党60多年,学雷锋50多年,我活一天就要学雷锋一天。”在陈文学看来,学雷锋只有起点,没有终点。

基于此,Testin云测直击行业痛点,旗下AI数据服务品牌“云测数据”将“精准高质”“独立安全”作为业务发展的核心并不断随AI企业数据需求不断的演进。Testin云测CTO陈冠诚重点提出了目前AI企业对定制化数据服务的迫切需求,同时也指出:当下,人工智能正加速往应用人工智能方向发展,在算法、算力没有重大突破的前提下,质量高和安全性强的数据成为人工智能商业化落地的关键点。

“活一天就要学雷锋一天”

2019年12月10日一大早,陈文学就来到位于青山区北嘉社区的陈文学红色志愿者服务工作室,今天有志愿者预约要来参观。“新三年旧三年缝缝补补又三年”陈文学举着一副鞋垫一边给大家展示,一边讲述手中鞋垫的来历和故事……

报道称,在大约半年前,这条商店街也出曾出现过6头野猪,其中2头还是小野猪,似乎是“一家人”正在觅食。

其实大家都了解AI在社会变革中的影响,若从技术角度来看,AI最大的改善是将把人从重复性的工作中解放出来,不轮是工业制造的重复性劳动,还是像医疗问诊的重复性劳动,亦或者是智能驾驶中的重复性劳动。一旦通过AI技术将人从繁复的工作中解放出来时,人们便能更好的投入到许多创造性的劳动中。

扩展来说,最早随着互联网的发展,诞生了大量用户的数据,比如用户上传的头像、发表的评论等数据。很多公司最典型的做法是用公开数据集、爬虫获取互联网上的人脸数据来训练一个模型。

这些需求会促使所有的AI数据服务提供方,必须至少具备三种能力:对场景深度的还原能力、作业协同化能力、专业化能力。

通过使用定制化数据服务,企业可以将自己算法的识别精度推到一个新的高度,进而落地成为产品被用户使用,而沉淀的用户数据以及用户在分享过程中逐渐产生的更多互联网数据,则会让整个数据库演变成大数据生态。

光明日报记者 高平 光明日报通讯员 王泽

陈文学义务宣传雷锋事迹的精神温暖感动着人们,他的坚守也得到了社会的认可。受陈文学老人的影响,一支100多人的“义工队”加入街头清理小广告、修理自行车、关爱空巢老人等爱心服务中;而向最美党员陈文学看齐系列活动中,评选出的百名最美党员、百名党建公益明星等也发挥典型带头作用,开始了弘扬志愿服务精神的行动……

我们目前支持智慧城市、智慧金融、智能驾驶、智能家居等领域。今天随着AI在各个行业的落地及定制化数据产品的需求,这应该是未来最重要的趋势之一。这是我今天的分享,希望对大家有所帮助。谢谢大家!

据介绍,由于收到了多件目击到野猪的报告,当地政府已经在山里设置陷阱,准备对附近的野猪实施抓捕。

第一,不滥用数据,数据交付后清毁数据不留底,绝不二次使用;

推广:猎云银企贷,专注企业债权融资服务。比银行更懂你,比你更懂银行,详情咨询微信:zhangbiner870616,目前仅开通京津冀地区服务。

最重要的一点,我们一直将数据隐私、数据安全作为业务开展的首要地位。

定制化场景:新兴数据的产生

AI三要素:相互制约、相互促进

定制化设备和场景化数据,不仅考虑到新维度数据采集硬件差异化凸显的现状,还可以规避单一维度数据对算法上升成本增加的负面影响,同时也能发挥新维度数据融合加速落地场景的优势。通过定制的方式,可以获得实际场景所需的数据,反之,如果没有这样的数据,相关企业在具体场景中会很难工作。

入冬后的第一场大雪让包头的气温降到了零下十几摄氏度,地面也有不少结冰和积雪,但这并没有阻挡陈文学外出学雷锋、宣传雷锋精神的步伐。

以下为陈冠诚演讲实录,猎云网整理删改:

在众包平台上发布一个悬赏的任务,感兴趣的用户接受悬赏任务,授权给自己采取的多个角度的照片,如此可以把人脸识别模型做的更好。但随着数据需求的提升,众包方式采集的数据可能就满足不了算法的精度需求。算法可能需要更高精度的数据进行训练,比如2000万摄像头拍出来的照片,同时对照片拍摄的角度和光线都可能有特定的需求。这个时候便产生了定制化的数据服务需求。这也是我们AI数据服务的优势领域所在。

第三,建立相关的数据保障机制,如从防火墙的设置、内部信息系统的管护、乃至标准化的流程作业体系等。

对于场景还原能力,首先体现在对用户真正的需求是否能够做到很好的拆解,甚至是预判,但仅仅是预判出来怎么做还是不够的,可以提前给更多的需求建议,应该怎样做、怎么复现场景才能保证算法顺利落地。这都是考验场景还原能力。

领域专业化上可以举个例子,在医疗领域做X光片病理诊断中,大多数情况下标注人员不是随便找一个普通人员就可以做,标注人员需要非常专业,甚至是副主任医师专业以上的,才能对病理的片子进行正确的数据标注与解读。类似的事情在各个领域中也多有发生,AI在各种各样垂直领域进行落地,比如说教育、法律、智能驾驶,都有细分专业化的要求。

在陈文学红色志愿服务工作室内,他还用50多年来收集的几百本书籍以及图片设立了毛主席展室、周恩来展室、雷锋展室等,先后接待各地参观学习人员10万余人次,为中小学生和社会各界人士作报告几千场,他用实际行动践行和传承着雷锋精神。而他的精神也犹如一缕阳光温暖着这座城市。

此次盛典上,猎云网将通过六个版块分享创业者和投资人在智能制造、文娱、零售、医疗、教育、汽车等领域的启发性的观点和行业前瞻,围绕多个维度,分享科技和产业前沿观点,探讨创新潮流趋势、把握未来新方向。

捐款近30万元帮助学生和老人

但是紧接着发现一个问题,如果只是训练一个精度较低的人脸识别模型,这些通用数据是可以满足,但却没办法在垂直领域进行人脸识别的应用,不能实现商用。

第二,不侵犯隐私,与所有数据采集的用户都签订数据授权协议,包括欧盟非常严格的GDPR协议我们会做支持,确保AI企业用于训练的数据合法合规;