강력한 총 구글, AI 학습자는 검색에 데이터 자산의 시대, 축복!

그림 삽입 설명 여기
인터넷이 상승하는 경우 1995 년, 다양한 정보 시작 인터넷은 세계의 인터넷 거인의 급속한 상승, 전체 인터넷 업계는 포털의 시대에 안내했다을 제공하기 위해 야후, 야후 디렉토리로 밝혀졌다. 인터넷의 첫 번째 주민들은 시간 즉, 인터넷에서 정보를 얻기 위해, 당신은 야후, 뒤적 거리다 디렉토리 페이지 후 페이지와 포털에 로그인해야합니다. 그럼에도 불구하고, 그것은 또한 크게 정보에 대한 접근을 용이하게합니다.

그러나, 인터넷 정보의 폭발적인 성장과 함께,이 포털은 단순히 성장 급등 만날 수없는 디렉토리의 형태로 인터넷 콘텐츠를 포함. 그래서, 키워드에 대한 사용자 검색을 기반으로 스마트 검색 알고리즘에 의해 한편으로, 파충류 실시간 인터넷 정보를 크롤링 가장 적합한 웹 페이지를 일치함으로써 한편으로는 회사의 대표로 구글 검색 엔진, 구글은 또한 주요 포털 넘어 가지고, 새에 인터넷 거인들.

초보자 사이에 다리를 걸쳐 기계 학습 및 인공 지능, 데이터 세트의 학습 과정에서, I :

기계 위치를 찾을 수있는 대용량 데이터 세트의 요구 사항을 학습?

기계 학습 연습 매우 상세한 해적 (1) : 재고 엔트리 레벨 데이터 세트 계란 사람들을위한 재미 있고 유용한 scikit가 배울

두 기사는 데이터 수집 사이트와 아이디어를 찾고 어떤 초보자를 출시했다. 그러나, 이러한 방법 데이터 세트를 찾고 다른 사이트에 로그인해야하고 그 데이터가에서 사용되는 세트를 뒤적 거리다 수 있습니다. 그것은 내 글이 아직도의 "포털"1.0의 시대에 갇혀 거의 모든 해답이 포함 알고 포함한 데이터 세트를보고 말할 수있다.

당신은 단순히 그것에 키워드 검색 엔진을 입력, 인터넷에서 특정 지식, 또는 사진을 찾을 필요가 있다면 사실, 데이터 세트는 기본적으로 메시지입니다. 이 키워드를 입력 할 수 있는지 여부,이 필드 그것의 모든 데이터 세트를 찾을 수 있습니까?

如今,经过一年的测试,谷歌正式推出了一款名为“Google Dataset Search”的数据集专用搜索引擎,目前已经涵盖了2500万个数据集,以后需要数据集,只需要从这个统一入口寻找就可以了,彻底让寻找数据集进入“搜索时代”。网站界面如下所示:
그림 삽입 설명 여기
目前,搜索引擎收录的数据集涵盖了地球科学、生物学和农业等各种领域。包含了世界上大多数政府、科研机构、大学等机构发布的数据集,而且数据集的数量继续增加。并且支持普通人按照schema.org的开放标准添加和上传数据集。

利用这个数据集搜索工具,我们可以通过简单的关键字来查找全网中的数据集。对初学者来说,可以更方便地寻找自己感兴趣的数据集,对于整个人工智能行业来说,一方面形成一个数据共享生态系统,鼓励数据发布者按照规定格式存储和发布数据;另一方面也为数据科学家提供相应平台,方便大家引用他们创建的数据集,以使他们的研究成果获得更大的影响力。

一、使用方法

1、搜索方法

进入““Google Dataset Search”网站(网站地址:Dataset Search),这里,我们搜索一下经典的“泰坎尼克号”数据集,可以看到,左侧列出了很多数据集来源。点击排在第一位的kaggle源,还可以查看该数据集的作者、支持下载的格式、数据集的说明、数据集大小等信息。
그림 삽입 설명 여기
再搜索一个鸢尾花数据集看看结果:
그림 삽입 설명 여기

2、筛选搜索结果

对于搜索结果,还可以根据更新日期、下载格式、使用权限、是否免费四个条件进行筛选。进一步定位我们需要的数据集。
그림 삽입 설명 여기

从以上搜索流程中可以看到,数据集的搜索和我们平常的搜索习惯和方式并没有什么不同。

3、其他应用

kaggle 경쟁 웹 사이트로, 또는 데이터의 타이타닉 세트 같은 이는 많은 웹 사이트 게시 된 데이터 세트는, 예를 들어, 데이터가 시간을 설정 다운로드, 데이터 세트, 홈 페이지에 직접 kaggle 점프를 클릭, 당신은 또한 길을 볼 수 있습니다 다른 구현 코드.
그림 삽입 설명 여기
즉, 검색 엔진에 의해 만 데이터 세트에서 찾을 수 없습니다, 당신은 또한 문제를 찾기 위해, 인 게임 및 몇몇 선수에 해당하는 데이터의 생각하지만, 답을 찾을 수있는 방법을 찾을 수 있습니다.

두 부족

국내 사용자의 경우, 두 가지 단점이있다, 하나의 중국에 대한 지원은하지 매우 친절이다. 예를 들어, 홍채 데이터 세트를 검색 할 때, 당신은 중국어, 프롬프트를 입력하는 경우 : 일치하는 데이터 세트를 찾을 수 없습니다.
그림 삽입 설명 여기
둘째, 인터넷은이 사이트에 액세스하는 몇 가지 기술이 필요합니다.

이제 장애물이 우리 앞에, 그리고 일부 인터넷 기술과 언어의 한계를해야합니다.

최근에 작성된

, Tensorflow 깊은 학습 프레임 워크, Colab 무료 클라우드 컴퓨팅 실험실, 각종 논문, 그리고 "뭔가를 그리기"몇 년 인기 최고 및 기타 인공 구글 검색을 시작뿐만 아니라, 인공 지능에서 최근 몇 년 동안 위대한 업적을 만든 것 작은 프로그램을 스마트, 구글의 손에서입니다. 심지어 또한 구글 수익의 지휘하에, 인공 지능 DeepMind 화재 회사의 분야를 주도 Alphago을 개발했다.

인공 지능 지식의 연구에서 데이터 세트가 확실히 그냥 검색 엔진 구글 원점을 검색해야하고, 검색을하고 공통의 지식 간단하게 데이터 세트를 검색 할 수있는 힘을 가질 수밖에 없다.

캐주얼 Tucao 하나 바이에 서있는 국내 다리는 구글이 자신의 데이터 세트 국내 검색 시스템을 구축 따라하기를 희망, 공포는 먼 꿈입니다.

################################################## ############

당신이 그것을 유용 경우 엄지 손가락은 ~ 챈트를 따라 이상에 초점

게시 67 개 원래 기사 · 원의 찬양 (204) · 전망 280 000 +

추천

출처blog.csdn.net/u013044310/article/details/104113411