Machine Learning on Google Cloud Platform (Cloud Next ’18)

[음악 재생] 안녕, 여러분 모두들 안녕

관객 : 안녕하세요 크리스 클리브런 : 좋아요 제 이름은 크리스 클레 ​​반입니다 Justin Lawyer와 함께 우리는 제품 관리자입니다 Google 클라우드에서 우리는 당신과 대화 할 것입니다

GCP에서 기계 학습에 관한 정보 그래서 저는 매우 투명한 사람입니다 나는 그것을 무엇보다 명확하게 할 것입니다 나는 당신의 테이크 아웃이이 이야기에서 나온 것이기를 바랍니다 하나, 당신이 정말로 흥분하기를 바랍니다

기계 학습으로 할 수 있습니다 둘, 자신감을 갖기를 바래 조직에서 기계를 성공적으로 구현할 수 있는지 확인하십시오 Google Cloud로 학습하십시오 셋째, Google AI의 관심사를 통해이를 신뢰하십시오

우리는 당신의 ML을위한 올바른 플랫폼이자 파트너입니다 워크로드 세 번의 테이크 아웃 이요 우리는 당신이 그 테이크 아웃을 얻으려고 이야기 할 것입니다 우리가 그것을 파고 들기 전에, 나는 단지 당신에게 감사의 말을 전하고 싶다

우리 모두는 바쁜 삶을 사는 데 제한된 시간을 가지고 있습니다 Google Cloud, 다음 컨퍼런스, 이 세션 고마워 ML이 당신을 위해 무엇을 할 수 있습니까? 그것은 놀라운 것들을 많이 할 수 있습니다 조직에 경쟁이있는 경우, 그들이 ML을보고 있다고 보장합니다

자, ML은 반드시 정신병자를 발명하는 것이 아닙니다 교통 수단을 이용하는 경우 순간 이동을 어떻게 만들지가 아닙니다 기존 비즈니스 및 프로세스를 이용하는 것입니다 다시 상상하고 재발견 할 수있는 능력 너 오늘하고있는 일 ML에는 세 가지 종류의 큰 영역이 있습니다

통찰력을 얻는 데 도움이 될 수있는 도움이 될 수 있습니다 또는 고객이 제품 혁신에 도움을 줄 수 있습니다 자동화에 도움이됩니다 진짜 자동화를 빨리 봅시다 자가 운전 트럭과 자동차 – 모두가하는 사업 교통과 택시로 오늘하고있다

그것을 더 빠르고, 저렴하게, 더 쉽고, 더 안전하게 만들어줍니다 혁신을 살펴 보겠습니다 우리 고객 중 한 명이, 디즈니, 우리의 제품 AutoML을 사용하여 혁신 그들의 소매 서비스 사용자 경험을 원했습니다 그들이 찾고있는 제품을 정말 빨리 찾을 수 있습니다

그래서 그들은 웹 인터페이스를 사용하여 커스텀 모델을 만들었습니다 전문 지식이 필요하지 않습니다 그리고 지금 그들의 수색 경험에서, 당신은 "해변에 미키 마우스"를 입력 할 수 있습니다 해변과 관련된 모든 제품을 찾습니다 그리고 미키 마우스 – 정말로 멋지다, 정말로 쉽다

그리고 통찰력 – 당신이 비행기라고 가정 해 봅시다 제조사, 항공기, 그리고 당신은 정말로 안전에 관심이 있습니다 IoT 덕분에 엄청난 양의 데이터가 있습니다 이 악기들이하고있는 것 그리고 그 데이터를 수집한다면 어떻게 처리할까요? 그리고 아마 당신이 그걸 예측할 수 있다면 어떨까요? 비행기 정비 전에 필요한 정비 부품 정기적으로? 안전에 대한 통찰력, 그래서 무엇에 대해 흥분을 느끼는지 귀하의 조직이 할 수 있습니다

그래서 손을 보여줍니다 누가 여기에, 그들의 조직, 찾고 있습니다 오늘 기계 학습으로? 큰 손을 한 번 더 보여줍니다 여기 누가 기계 학습이 무엇인지 이해한다고 생각합니까? 네가 반 정도는 마지막 질문 – 누가 기계 학습 모델인지 알 수 있습니까? 네, 대부분

그래서 이것에 대해서 간단히 만질 것입니다 기계 학습은 데이터에 관한 것이며 데이터를 가져 오는 것입니다 통찰력과 행동 거기에는 모든 종류의 데이터가 있습니다 이미지, 구조화되지 않은 텍스트, 관계형 데이터베이스, 시퀀스 정보

그리고 기계 학습은 그 데이터를 취하는 것입니다 다양한 종류의 ML 알고리즘을 취하고, 그 알고리즘을 통해 그 데이터를 통과 거대한 인프라 세트가 필요합니다 그리고 그 데이터를 통과하면, 기계 학습 모델이 생성됩니다 그리고이 모델은 점점 좋아집니다 더 많은 데이터, 더 나은 알고리즘, 더 많은 인프라

그리고이 모델을 사용하여 통찰력, 자동화, 혁신 그래서 우리 모두는이 서비스, 웹 검색을 알고 있습니다 Google은 AI 회사이자 데이터 회사입니다 18 년 동안 세계 데이터 수집, 모든 사람이 접근 가능하고 사용 가능하게 만듭니다 우리는이 분야에서 많은 전문 지식을 보유하고 있습니다

대규모 데이터 센터, 인공 지능 전문가, 데이터 전문가 Google Cloud가 제공하는 전문 기술은 ML에 너에게 이것은 우리가 내부적으로 가지고있는 것에 대한 멋진 작은 이야기입니다 ML을 성공적으로 구현했습니다 Brein이라는 내부 AI 팀은 ML 모델을 만듭니다

알고리즘을 통해 수많은 데이터를 가져와 대규모 인프라 스트럭처를 통과시켜야합니다 ML 모델을 만들 수 있습니다 하지만 Google의 모든 소프트웨어 개발자는 아닙니다 ML 전문가입니다 우리가 한 일은 우리의 소프트웨어를 둘러 보았습니다

개발자를 교육하고 기존 모델로 ML을 구현하는 방법 그래서이 그래프가 보여주는 것은 소스 코드의 개수입니다 개발자가 Brain의 ML 모델을 사용하는 저장소 AI를 내부 서비스에 성공적으로 구현하기 위해, 외부 제품 Google은 이러한 유형의 개념을 Google Cloud에 도입합니다 오른쪽에는 여러 제품이 있습니다

ML과 AI를 통합했습니다 나는 그들 모두에 대해 이야기하지 않을 것이다 나는 두 가지에 대해서 이야기 할 것이다 내 즐겨 찾기 그래서 저는 아빠입니다, 저는 세 명의 아이들이 있습니다

그리고 저는 아이들의 디지털 사진을 많이 찍었습니다 어리석은 금액, 아마도 총 10 만개 그리고 저는이 Mac을 가지고 있었고 하드 드라이브가 몇 개 있었는데, 저장 용량이 걱정되어 Google 포토가 생겼습니다 무료 무제한 저장 글쎄, 잘됐다

값이 싸고 확장 가능하며 물건을 뒷받침하는 것에 대해 걱정해야합니다 그러나 실제로, 혁신은 검색 기능이었습니다 얼굴 인식 기능이 있으며 우리 애들이 누군지 알고 있습니다 내 얼굴 사진을 클릭 할 수 있습니다 내 전화에서 해변이나 보트 같은 단어를 입력하고, 이제 10 만 장의 사진을 찍습니다

내가 찾고있는 정확한 사진을 찾습니다 과거에는 20 분이 걸렸을 것입니다 ML은 혁신적이며 그렇게 할 수도 있습니다 조직의 규모에 관계없이 기술 직원 유형에는 ML을 구현하는 여러 가지 방법이 있습니다 그리고 우리는 두 가지 방법에 대해 이야기 할 것입니다

첫 번째 방법은 ML 모델을 사용하는 것입니다 ML 전문가가 될 필요는 없습니다 소프트웨어 개발자 일 필요가 있습니다 또는 귀하의 조직이 REST API를 사용하는 프로그래밍 언어 사용하기 쉽다

CXO 나 결정을 내리는 경영자라면, 프로젝트에 자금을 지원합니까? 높은 품질의 모델을 만드는 것은 매우 위험합니다 소프트웨어 개발자에게 API를 사용하게한다 그것을 구현하고, 정말로 빨리 시작하십시오 그리고 다른 길은 커스텀 모델을 만드는 것입니다 어쩌면 당신은 당신의 공간에서 도메인 전문가입니다

또는 데이터에 액세스 할 수 있고 원하는 자신 만의 ML 모델을 만들 수 있습니다 그래서 우리는 전문가들을위한 많은 도구들을 가지고 있습니다 빠르고 저렴한 ML 처리를 위해 그리고 여기가 저스틴에게 넘겨 줄 것입니다 그리고 그는 이것들에 대해 조금 이야기 할 것입니다

자세한 세부 사항 크리스틴 고마워 고마워, 크리스 그래서와 주셔서 대단히 감사합니다 오늘, 우리는 이야기 할 것입니다

당신의 직업에 맞는 도구를 어떻게 찾을 수 있습니까? 당신의 분야에서 전문가로서? 그래서 우선, 크리스가 언급 한 것처럼, Google은 많은 기계 학습 모델을 만들었습니다 특정 애플리케이션이 Google 애플리케이션을 강화할 수 있습니다 그래서 우리는 당신 주위에 REST API를 포장했습니다 소비하기 위해 우리는 이것을 지각 API라고 부릅니다

그들은 일반적으로 인간의 인식 주위에 있기 때문에 사용자가 애플리케이션과 상호 작용하는 방식 이렇게 빨리 다음 슬라이드로 이동하면, 이 API에는 크게 세 가지 범주가 있습니다 하나는 사이트에 관한 것이고 다른 하나는 대화에 관한 것입니다 세 번째 것은 언어에 관한 것입니다 아마 이들 각각을 걸을 것이 중요하다고 생각합니다 정말 신속하게 당신이 일종의 즉석에서 이해할 수 있습니다

코딩 없이도 얻을 수있는 기능 REST API를 사용하는 것 외에는 귀하의 응용 프로그램에 그래서 우선, 시력을 위해, 당신이 이미지를 가지고 있다고 말하면서, 그 이미지의 내용을 이해하고 싶습니다 자동으로 이미지를 Vision API에 전달하면 그 이미지 안에있는 물체가 무엇인지를 이해할 수 있습니다 자동으로, 그리고 당신은 얼굴이 어디 있는지 알아낼 수 있습니다, 다른 사람들에게 알릴 수 있습니다 동영상 이해 API의 경우 동영상, 장면 전환, 다른 대상을 알려줄 수 있습니다

해당 비디오 내에서 기본적으로 검색하고 찾을 수 있습니다 동영상 내 또는 동영상 전체에서 원하는 내용 여러 동영상을 전달하는 경우 OCR – 종종 사람들은 스캔 한 문서를 가지고 있습니다 그리고 무엇을 이해해야합니까? 도크는 그 문서에 있습니다 어쩌면 그것은 PDF 파일 일 수도 있고 GIF 파일 일 수도 있습니다

너는 할 수 있어야한다 GIF, JPEG가 아닙니다 API에 전달할 수 있습니다 그런 다음 자동으로 감지합니다 그 문서의 단어들은 무엇입니까? 그 원시 텍스트를 나중에 줄 수 있습니다

또는 장면의 이미지를 가지고 있거나, 벽에 징후가있다 그것은 당신에게 그 사인에 관한 텍스트를 줄 것입니다 따라서 OCR은 일상적인 응용 프로그램에서 정말 편리합니다 성인용 콘텐츠는 사실 실제로 하나입니다 정말로 중요합니다

사용자가 제출 한 콘텐츠를 얻으십시오 당신은 그 이미지에 무엇이 있는지 모릅니다 당신은 당신이 아닌지 확인해야합니다 사용자에게 부적절한 이미지를 제공합니다 따라서 성인용 콘텐츠 검색은 정말 쉬운 방법입니다

그 이미지에서 무슨 일이 일어나고 있는지 감지 할 수있게 당신이 걸러 내야 만하는 것이죠 귀하의 사용자에게? Conversation 클래스의 API의 경우 – 오디오를 텍스트로 – 스트리밍 오디오가있을 수 있습니다 그 다음 파일은 당신이 무엇을 말하고 있는지 알아 내야합니다 그런 다음 그 사건을 베끼고 그것을 당신에게줍니다 그것은 비디오, 사람들과의 실제 대화, 텔레비젼 쇼를 위해 무엇이든간에

그 반대도 가능합니다 텍스트 문자열이있을 수 있습니다 당신의 사용자에게 읽어 줄 필요가있다 자, 문자열을 응용 프로그램에 전달합니다 그러면 합성 음성을 만듭니다

그런 다음 사용자에게 알릴 수 있습니다 채팅 봇은 사용자와 소통 할 수있는 방법입니다 채팅에서 직접 원하는 상호 작용을 프로그래밍 할 수 있습니다 사용자와 대화하고 특정 종류의 대화를 프로그래밍 할 수 있습니다 계속해서 고객 서비스 전화로 도움을 받으십시오

또는 그런 것들 언어 API에서, 자유 형식의 텍스트를 가지고 있다면 정말 어렵습니다 정말 도대체 무슨 소리 야? 우리는 밖으로지도하고 무엇의 맥락을 알아낼 것입니다 말하자면, 문장의 데이터 구조를 찾아 내고, 당신이 알아낼 수 있도록 말의 부분을주세요 좋아, 명사 란 무엇인가? 동사는 무엇인가? 이것들의 관계는 무엇입니까? 그리고 나서, 당신은 지능적인 것을 할 수 있습니다

그 구조와 감정 분석은 함께 전송되는 분위기는 무엇인가요? 그 단어들로? 우리가 가진 것은 우리는 많은 좋은 성공을 시도했습니다

예를 들어 고객 서비스의 정서를 모니터하는 것 이메일이나 채팅, 물건 나가기 관리자에게 에스컬레이션 할 수 있음 그래서 물건들이 나선형으로 나오지 않도록 할 수 있습니다 제어 또는 무엇인가가 공격적인지 이해할 필요가 있다면, 또는 평온한, 또는 행복한, 당신은 어떻게 분류하고 있는지 확인합니까 고객이 평점을 매기는 것이 적절하다면 서비스 콜, 그런 것들? 번역에서는 자동으로 번역하는 좋은 방법입니다 한 언어에서 다른 언어로 예를 들어 다음에 대해 조금 이야기하겠습니다

예를 들어, 당신이 게임 개발자라고 말하면, 당신은 온라인 커뮤니티를 가지고 있습니다 하지만 그들은 전세계에서 온다 다른 언어로 말하기 당신은 그들이 서로 이야기 할 수 있기를 원합니다 실시간 채팅에서 기본적으로 할 수 있습니다

다른 언어로 번역 할 수있는 능력이 있어야합니다 따라서 Translate API를 사용하면 정말 쉽습니다 또는 인바운드 고객 서비스를받을 수 있습니다 이메일을 보내고 언어로 번역 할 수 있습니다 고객 서비스 담당자가 고객이 이해할 수 있도록 그러면 고객에게 응답 할 수있는 적절한 문서를 찾을 수 있습니다

이 API에 대한 좋은 점은 기본적으로 REST API 만 있으면됩니다 기본적으로 코드 스 니펫을 제공합니다 당신은 그것을 당신의 앱으로 팝니다 당신이 정말로 바꾸어야 할 유일한 것 데이터를 가리키는 키와 URI입니다 그리고 짜잔, 떨어져

그것보다 더 간단해질 수는 없습니다 다음 질문은 성능이 어떻습니까? 실제로 얼마나 효과가 있습니까? 그들은 일반적인 사용 사례에 정말 좋습니다 경우에 따라 문제가있을 수 있습니다 Google이 결코 다루지 않았던 또는 상황을 처리해야 할 수도 있습니다 Google이 다루어야 할 것보다 훨씬 더 자세하게 설명합니다

예를 들어 Google은 볼트와 못의 차이를 쉽게 알 수 있습니다 하지만 당신이 제조업 자라고 가정 해 봅시다 생산 라인에 2,000 개의 볼트가 있습니다 귀하의 부품에 대한 차이점을 어떻게 알 수 있습니까? 글쎄, 우리가 가능하게 한 것은 Cloud AutoML 그래서 당신은 라벨이 붙은 모든 부품의 이미지를 제공 할 수 있습니다 그리고 우리는 그들을 구별하지 못할 수도 있습니다

라벨을주지 않으면 그런 다음 모델을 교육합니다 그런 다음 REST API 엔드 포인트를 얻을 수 있습니다 귀하의 응용 프로그램에서 사용하십시오 그래서 좋은 점은 사용하기가 정말 쉽다는 것입니다

그리고 당신은 기계 학습을 알 필요가 없습니다 우리는 당신을 위해 그것을한다 그런 다음 응용 프로그램에서 사용할 수 있습니다 그래서 다음 질문은, 음, 이것이 얼마나 효과가 있습니까? 실제로 모든 오픈 소스보다 효과적입니다 밖에있는 모델

따라서 훌륭한 실적을 올릴 수 있습니다 그리고 사용하기가 정말 쉽습니다 그래서 정말 도움이되었습니다 그래서 실제로 ML을 사용하는 방법 중 하나입니다 또 다른 방법은 데이터 과학자가 있다고 가정 해 봅시다

내 자신의 데이터를 가지고 있기 때문에 내 모델을 만들고 싶습니다 그리고 그것은 내가 다룰 필요가있는 커스텀 문제입니다 음,이 작업에는 두 가지 다른 방법이 있습니다 하나는 클라우드 관리 서비스를 사용하고 있습니다 그리고 이것들은 당신이하지 않는 서비스입니다

인프라를 다루고 싶다 우리는 당신을 위해 그것을 다룰 것입니다 그렇게하면 컴퓨터 학습 프로세스에 집중할 수 있습니다 그래서 우리는 Dataproc과 Dataflow를 가지고 있습니다 그래서 당신은 당신의 전처리를 다룰 수 있습니다

Dataproc은 본질적으로 Hadoop 및 Spark이지만 관리, 또는 Dataflow가 백엔드에서 Beam을 사용하고 있습니다 프로세싱을 처리하는 관점에서 머신은, ML 엔진 또는 기계 학습 엔진, 인프라 스트럭처를 자동으로 가동시킬 수 있습니다 그리고 우리는 그걸 좀 알아볼 것입니다 당신이 끝나면 그것을 찢어 버려라 따라서 인프라 스트럭처가 사라집니다

데이터 과학자들로부터 모든 최상위 프레임 워크를 지원합니다 그리고 우리는 Datalab을 가지고 있습니다 데이터 탐색을 쉽게 할 수 있습니다 먼저 Datalab에 대해서, 얼마나 많은 사람들이 실제로 Jupyter Notebook을 사용했습니다 주피터 노트북에 대해 알고 있습니까? 약 3 분의 1 정도가 될 것입니다

나머지 사람들은 그렇게 이해합니다 주피터 노트는 근본적으로 데이터를 가리킬 수있는 앱 귀하의 데이터를 분석 할 수있는 코드를 제공하십시오

데이터를 시각화하고, 반환하고, 즉시보고, 얻을 수 있습니다 몇 가지 피드백을받은 다음 반복하여 반복하고, 그것을 계속 추가하십시오 전체 노트북을 재생할 수 있으며, 당신은 그저 특정 스 니펫을 연주 할 수 있습니다 직장 동료와 공유 할 수 있습니다 그래서 그것은 정말로 탐험하고 시각화하는 훌륭한 방법입니다

및 프로토 타입 그래서 환상적인 도구입니다 Datalab에 대한 좋은 점은 모든 다른 클라우드 서비스에 연결하도록 미리 구성 BigQuery와 ML 엔진 등이 있습니다 따라서 클라우드에서 벗어나기 만하면됩니다 랩톱에서 로컬로 사용할 수도 있습니다

기계 학습 엔진은 정말 좋은 방법입니다 임의의 데이터 사이트에서 분산 학습 수행 모든 상위 프레임 워크를 사용하여 데이터를 처리 할 수 ​​있습니다 그리고 다시, 그것은 관리 서비스입니다 따라서 모델과 데이터를 가리키고, 그리고 당신은 단지 그것을 회전시킵니다 그것은 당신을위한 모든 분산 훈련을 담당합니다

당신은 그것에 대해 걱정할 필요가 없으며 종료됩니다 모든 것을 찢어서 사용하는 것에 대해서만 비용을 지불합니다 그래서 이것을하는 것이 정말 효율적인 방법입니다 실수로 해당 VM을 켜두는 것에 대해 걱정할 필요가 없습니다 한달 전에 고지를 청구하고 청구서를받을 때

이것에 대한 또 다른 좋은 점은 배치 예측 및 온라인 예측도 수행합니다 기본적으로 이러한 일괄 예측 작업을 실행할 수 있습니다 정말 효율적입니다 또는 온라인 예측을 위해 REST API 끝점을 만듭니다 당신의 모델을 위해 당신을 위해 그리고 어떤 양으로도 봉사하십시오

당신은 당신이 가지고있는 많은 수의 앱을 필요로합니다 정말 쉬운 방법으로 앱을 관리 할 수있는 좋은 방법입니다 다른 하나는 데이터 과학자들이 종종 모델 최적화를하지 않는다 그것은 일종의 고통이기 때문에 모든 다른 매개 변수를 변경해야합니다

데이터 세트에 적합한 구성을 찾으십시오 글쎄, 우리는 그것을 ML 엔진에 내장했다 그래서 그것은 실제로 그것을 당신을 위해 간단하게 만듭니다 매개 변수 만 입력하면됩니다 최적의 모델을 찾으십시오

그래서 좋은 모델을 찾기보다는, 실제로 데이터 세트에 가장 적합한 것을 찾는 것입니다 따라서 모델 실적을 향상시킬 수 있습니다 관리 관점에서 모든 것을 하나로 모으는 것은, 우리는 전체 ML의 모든 단계에 대해 다른 서비스를 가지고 있습니다 애플리케이션에 대해 처리해야하는 라이프 사이클 우리는 섭취 측, 전처리 측, 저장 및 탐색 및 실험, 시각화 측면, 모델 교육 및 제공, Data Studio를 사용하여 보고서를 만들 수 있습니다

그것 모두는 우리의 관리 서비스에, 당신은 인프라를 다룰 필요가 없습니다 모든 호출기를 관리하는 SRE를 보유 할 필요는 없습니다 이렇게하는 다른 방법은 직접 해보는 것입니다 자신 만의 솔루션을 선보일 수 있습니다 사실 몇 가지 매우 유효한 이유가 있습니다

왜 일부 고객은 이것을 원할 것입니다 당신은 연구자 일 수도 있고 당신 일 수도 있습니다 스택의 모든 부분을 변경할 수 있기를 원한다 원한다면, 당신은 매우 맞춤화 된 파이프 라인을 가지고 있을지도 모릅니다 또는 당신이 최첨단을 원할 수 있습니다

오픈 소스 소프트웨어는 당신이 원하는 시점에 펑크 난다 여러 가지 이유가 있습니다 너는 그걸 원할지도 모른다 그게 전부입니다 우리는 그런 사용자를 좋아합니다

하이브리드 구현도 가능합니다 어떤 것들은 클라우드에 있고 어떤 것들은 온 – 프레미엄입니다 매우 일반적인 사용 사례입니다 우리는 그것을지지하고자합니다 그래서 직접 해보고 그것을 배포 할 방법이 있습니다

정말 중요합니다 따라서 우리와 똑같은 인프라 이전에 관리되고 있던 동일한 종류의 오픈 소스 플랫폼을 자동으로 롤백 할 수 있습니다 자신의 인프라에서 너는 그것을 관리한다 그리고 당신은 똑같은 하드웨어를 갖게됩니다

다른 솔루션에 전력을 공급합니다 그래서 우리는 얻는 것이 정말 쉽습니다 깊은 학습으로 시작되었습니다 깊은 학습은 정말 이륙하고 있습니다 복잡한 데이터에서 통찰력을 찾는 정말 좋은 방법입니다

세트 또한 인증 및 최적화 된 VM 이미지를 제공합니다 GCE에서 일하기 상자에서 꺼내면 Jupyter Notebook을 얻을 수 있습니다 모든 하드웨어에 액세스 할 수 있습니다

크리스가 잠시 후에 얘기 할 것입니다 그리고 가능한 최상의 결과를 얻을 수 있도록 구성되었습니다 따라서 클릭 한 번으로이 항목을 배포 할 수 있습니다 원하는 기계에 접근하여 접근하기 당신이 원하는 모든 액셀레이터에게 즉각적으로 갈 준비가되었습니다

우리는 약속에 대해 언급했다 Google이 오픈 소스 커뮤니티에 미친 영향 Kubeflow는 제가 좋아하는 오픈 소스 프로젝트입니다 지난 가을에 Kubernetes에서 시작되었습니다 특정 ML 작업을위한 마이크로 서비스를 만들 수 있어야한다

분산 형 교육 또는 분산 형 당신이 원하는 곳마다 다른 종류의 모델을 제공하고, 그것이 GCP에 있든 또는 온 – 프레스에 있든 상관 없습니다 따라서이 컨테이너를 배포하는 데 매우 휴대 가능한 방법입니다 당신이 원하는 곳이라면 그런 식으로 배포 할 수 있습니다 일관된 GCP 또는 온 – 리소스 일치에 대해 걱정할 필요가 없습니다

Kubernetes가 그것을 처리하기 때문에 이 모든 것을 다룰 수있는 쿠버 넷 고유의 방식입니다 그리고 다시 CPU, GPU 및 TPU에서 작동하도록 구성되었습니다 GCE에 온 – 프레미스 (On-prem), 내부적으로 가지고있는 모든 것에 액세스 할 수 있습니다 그렇다면 GCE에 배포하면 어떻게 될지 모르겠습니다

GKE 클러스터를 생성하고, 그것은 GCP의 관리 Kuvernnetes 클러스터입니다 그러면 JupyterHub 노트북을 스핀 업할 수 있습니다 TensorFlow 교육 서비스 또는 기타 프레임 워크를 시작하십시오 너는 넣고 싶었고 똑같은 일을했다 당신의 TensorFlow 서빙을 위해

모든 사용자가 공유 저장소에 액세스 할 수 있습니다 GCP에서 Kubernetes에게 자연스럽게 따라서 실제로 할 수있는 좋은 방법입니다 이것은 매우 휴대용 방식으로 그런 다음 전체 컨테이너를 원하는 위치에 배치 할 수 있습니다 그리고 그것은 환상적인 해결책입니다

그래서 지금, 나는 시간을 보낼 것입니다 Chris에게 하드웨어에 대해 이야기 할 것입니다 크리스 클리브 : 감사합니다, 저스틴 테이크 어웨이로 돌아가서, ML에 흥미를 느끼고, Google 클라우드에 ML을 구현할 수 있다고 확신하면서 Google의 인공 지능 (AI) 포커스는 우리를 귀하의 ML에 적합한 파트너로 만들어줍니다 워크로드

정말 빨리 이야기 해 봅시다 단지 이러한 것들을 되풀이하기 위해서입니다 개발자이고 ML을 구현하려는 경우, ML 전문가가 될 필요는 없습니다 API 모델을 사용하십시오 위험을 낮추십시오

사전 훈련 된 ML 모델이 마음에 들지 않는 경우 또는 사용자 정의 무언가를해야합니다 AutoML과 함께 웹 브라우저를 사용하여 사용자 정의 ML 모델을 작성하십시오 놀라운, 슈퍼 간단합니다 그리고 데이터 전문가 또는 기계 학습 과학자 인 경우, 또는 도메인 전문가가 작업 부하에 적합한 도구를 제공합니다 게다가

Google 클라우드에 ML을 성공적으로 구현할 수 있습니다 그러나 컴퓨팅 및 인프라에 대해 간단히 이야기 해 봅시다 ML과의 관계 최근 AI 개선 및 발전의 80 % 더 많은 이용 가능한 컴퓨팅 성능에 기인 한 것입니다 그러나 최근의 TensorFlow 이벤트에서, 설문 조사에 따르면 사람들이 접근 할 수 없다는 것을 인정합니다 ML 연구를 위해 충분히 계산할 수 있습니다

그것은 분명한 문제입니다 이제 수십 년 전으로 돌아 가자 왜냐하면 우리 모두 우리가 서있는 ML에서 일하는이 방에서 거인의 어깨에 신경망과 ML의 작동 방식에 대한 개념, 수십 년이 지났습니다 인간의 두뇌를보고, 어떻게 뉴런이 서로 연결되어 있는지, 그들이 정보를 전달하는 방법 한 뉴런에서 다른 뉴런으로, 그것은 오래된 개념입니다

하지만 최근의 구현입니다 대규모 데이터 센터 및 하드웨어 가속기 우리가이 큰 신경 네트워크를 만들 수있게 해줬습니다 ML의 발전 인프라가 중요합니다 그리고 그것이 중요한 이유는, 당신이 어떤 길로 가든 상관없이 – Google ML 모델을 사용하여 맞춤 모델 만들기 – 그것을 지탱하고있는 인프라입니다

우리 모델에서는 이미 데이터를 가져 왔습니다 훌륭한 알고리즘을 통과 시켰습니다 이 인프라, 대규모, 축구 규모의 현장 데이터 센터 이 모델들을 더 좋고 더 좋게 만드십시오 그리고 우리는 계속 그렇게 할 것입니다 Google Cloud를 사용하면 그 같은 규모로, 너와 그것을 할 수있는 것과 똑같은 힘 알맞게

GCP에 관한 새로운 ML 고객 중 한 명 OpenAI이고 대규모에 대해 이야기합니다 그들은 관리되지 않는 길로 갔다 그들은 도메인 전문가이고, 그들은 AI 사고 리더입니다 그들은 비영리 단체입니다 AI로 혁신하고 개방적이고 안전하게 만들기 위해 노력하고 있습니다

그들은 10 만개 이상의 프로세서를 사용합니다 보강 학습을 할 수 있습니다 수천 개의 GPU를 사용하여 기계 학습을하고 있습니다 혁신을 가능하게하는 것은 규모에 대한 접근입니다 그 (것)들을 위해 그것을 제공하고있는 Google Cloud입니다

하드웨어 가속기는 매우 중요합니다 하드웨어 혁신뿐입니다 CPU가 있으면 Skylake를 사용할 수 있습니다 그러나 ML 작업 부하의 경우 분산 된 교육의 경우 커다란 교육 일자리가 생기면 마비 된 계산 능력이 필요합니다 따라서 우리는 역사적으로 2017 년 2 월 이후로, 우리는 세 개의 NVIDIA GPU 모델 인 K80, P100, V100, 고성능, 패스 스루 PCI입니다

V100을 사용하면 NVLink 상호 연결이 가능하며, ML 워크로드에 아주 좋습니다 우리가 조금 다른 것보다 우리의 경쟁 업체는 맞춤 VM을 제공하는 방식을 사용합니다 CPU 사용량, 메모리 사용량, 기타 GPU 유형, 보유하고있는 GPU 수, 원하는 VM 수, 네트워크 연결 스토리지를 사용하거나 고속 디스크를 원할 경우 특정 작업 부하에 대한 I / O, 서버 내 SSD 연결, 그리고 당신이 원하는 것을 지불하십시오 또는 병목 현상이있는 경우 그 중 하나를 조정하십시오 우리의 다른 경쟁 업체 중 일부는 유연성을 제공하지 않습니다

그래서 돈을 저축하려고합니다 ML 작업이 더 빨리 진행될 것입니다 사실은 이번 주에는 새로운 P4 GPU를 출시했습니다 일주일 후에 나올거야 ML 추론 워크로드에 유용합니다

따라서 우리는 파트너 인 NVIDIA와 계속 협력 할 것입니다 새로운 GPU를 시작하십시오 그래서 우리는 거기서 멈추지 않습니다 AI에 초점을 맞추면 TPU가 생깁니다 우리는 Cloud v2 TPU를 작년에 만들었습니다

이것은 기계 학습을 위해 의도적으로 제작 된 ASIC입니다 그리고 오늘, 우리는 몇 가지 새로운 발표를했습니다 v3이 나오고, 빠르고 저렴한 ML 작업 부하 TPU 포드가 있습니다 TPU 포드는 일련의 TPU입니다

빠른 네트워크로 연결됩니다 다시 한번, 구글의 AI는 인프라를 구축하는 데 중점을두고 있습니다 우리는이 ML 모델을 더 빨리 교육하고 있습니다 우리는 또한 당신에게 그것을 제공하고 있습니다 우리는 당신의 ML을위한 올바른 파트너라고 믿어야합니다

워크로드 저축은 많은 돈입니다 많은 회사에 크고 큰 거래 스탠포드에 예산이있는 조교수가 있습니다 ML에서 몇 가지 연구를 수행합니다

그리고 그는 고정되어 있습니다 – 그가 할 수있는 일은 너무 많아 따라서 관리되지 않는 경로의 윈 – 윈 제품 – 선점 형 VM, 선점 형 GPU 및 TPU가 있습니다 때로는 여분의 용량이 있습니다 또한 교육 및 추론과 같은 ML 배치 워크로드, 우리는 GPU와 TPUs의 70 % 할인을 제공하고 오늘 아침에 발표했습니다 TPUs의 가격을 인하했습니다

그래서 지금,이 연구원은 우리의 여분의 수용력을 사용할 수 있습니다, 약간의 비용 절감, 배치 워크로드 실행 모든 사용 사례에 해당하는 것은 아닙니다 보장되지 않습니다 항상 거기있는 것은 아닙니다 하지만 연구를하고 있다면 필요한 일이나 큰 조직을해라 배치 작업 부하가 한 번씩 적은 비용으로 더 많은 혁신을 할 수있는 좋은 방법입니다

ML에서는 데이터가 정말로 중요합니다 Google은 훌륭한 광섬유 네트워크, 훌륭한 인터넷 서비스를 제공합니다 사이 따라서 데이터를 큰 단위로 이동하는 경우, 우리는 그것을 처리했습니다 실시간으로 들어오는 대규모 데이터 흐름이 다양한 출처 – 우리는 전 세계에 구름 위치를 가지고 있습니다

일부 데이터를 우리에게 발송해야하는 경우, 우리는 당신이 대량으로 출하 할 수있는 가전기구를 가지고 있습니다 그것은 단순한 계산이 아니라 훌륭한 인공 지능 서비스입니다 그것은 네트워크입니다 보안입니다 그것은 거기에 내장 된 모든 것입니다

그래서 우리는 많은 인공 지능 서비스에 대해 이야기했습니다 우리는 당신에게 개요와 소개를주었습니다 우리는 ML이 불가능 발명에 관한 것이 아니라는 것에 대해 이야기했습니다 그것은 재상영과 재발생에 관한 것입니다 너 오늘하고있는 일

현재 14,000 명이 넘는 고객이 GCP에서 ML을하고 있습니다 오픈과 하이브리드에 중점을두고, 및 멀티 클라우드 작업 부하, 하드웨어에 중점을 둠, 우리가 발표하는 우리의 새로운 서비스, 그리고 언급 한 기조 연설, 새로운 AutoML 서비스, 고품질 API – 네가 어떻게하고 싶은지 상관 없다 당신이 할 수 있다는 것에 흥분을 느껴야합니다 당신은 당신이 성공적으로 그것을 할 수 있다고 확신해야합니다 Google은 귀하에게 적합한 파트너입니다

더 배우고, 시작하고, 얻을 수있는 여러 가지 방법이 있습니다 세워짐 내가 특별히 말하고자하는 것은 내가 개인적으로 Kaggle이 사용되었습니다 Kaggle은 ML 대회 서비스 및 커뮤니티입니다 나는 ML을 배울 때, 내가 뭘하는지 몰랐다

그리고 이미지 인식 경쟁이있었습니다 운전자가 도로에주의를 기울이거나 또는 산만 한 느낌 그래서 커뮤니티에 가입하여 ML 도전에 합류했습니다 TensorFlow를 사용하는 방법에 대한 많은 리소스가있었습니다 및 데이터를 사전 처리하는 방법

그리고 Google은 Kaggle을 사용하여 전 세계 사람들을 돕고 있습니다 ML을 배우십시오 그리고 너도 그걸 쓸 수있어 또는 데이터 세트가 많은 조직의 경우, 당신은 경쟁을 시작할 수 있고 세계의 ML 전문가를 가질 수 있습니다 너를 위해 ML을해라

방법에 대한 자료가 많이 있습니다 이러한 서비스에 대해 알아보십시오 Google Cloud 고객이 아닌 경우 무료 크레딧이 제공됩니다 이미 그래서 그 점에 대해 감사 드리고 싶습니다

우리 시간은 거의 다됐다 우리는 몇 가지 질의 응답을 할 것입니다 양쪽에 2 개의 마이크 그리고 몇 가지 질문을하십시오 고마워요

[박수 갈채] [음악 재생]

Learning Scikit-Learn (AI Adventures)

YUFENG GUO : Scikit-learn은 오래되었습니다 점점 인기있는 도서관이되었다

기계 학습으로 시작되었습니다 그러나 아직 시도해 볼 기회가 없다면, 괜찮아 함께 확인해 봅시다 Cloud AI Adventures에 오신 것을 환영합니다 우리는 예술, 과학 및 기계 학습 도구를 탐구합니다

내 이름은 Yufeng Guo이고,이 에피소드에서, Kaggle 커널에서 scikit-learn을 사용하여 시작하는 것을 도와 드리겠습니다 가이드 할 수있는 리소스가 있음을 알려줍니다 당신의 학습은 앞으로 나아갑니다 문맥에 대한 역사의 작은 대시로 시작합시다 Scikit-learn은 원래 scikits

learn이라고 불 렸습니다 Google Summer of Code 프로젝트로 시작되었습니다 David Cournapeau Scikit 부분은 SciPy Toolkit이라는 이름에서 유래했습니다 그리고 거기에서, scikit-learn는 꾸준히 가지고 있습니다

입양 및 인기를 얻은 곳 오늘은 잘 기록되어 있고 잘 사랑 받았습니다 파이썬 기계 학습 라이브러리 scikit-learn을 살펴 본다면 scikit-learnorg에서 – 그리고 너는 분명히 – 버전 번호가 매우 낮다는 것을 빨리 알 수 있습니다 0

19를 기록했다 그걸 두려워하지 마라 도서관은 꽤 오래되었습니다 매우 잘 관리되고 신뢰할 수 있습니다 scikit-learn에 대해 정말로 깔끔한 것은 무엇입니까? 여러 가지 작업을 수행 할 수있는 풍부한 도구 모음 나는 기계 학습을 "주변"이라고 부르고 싶다

여기에는 데이터 집합로드의 모든 내용이 포함됩니다 전처리 조작 파이프 라인 및 메트릭 제 의견으로는, 정말 놀라운 부분입니다 scikit-learn에 관한 정보는 광대 한 컬렉션입니다 모두 포함 된 기계 학습 알고리즘 그리고 당신은 그것들을 시험해 볼 수 있습니다

최소한의 코드 조정만으로 그것은 정말 놀라운 방법입니다 다른 유형의 모델은 물론 직관력을 얻습니다 특정 모델에 대한 다양한 매개 변수 행하다 scikit-learn의 간단한 예를 살펴 보겠습니다 Kaggle 커널에서 작동합니다

우리는 여기 동물원 동물의 데이터 세트를 가지고 있습니다 단지 101 개의 다른 동물 분류 작업은 이 동물들이있는 7 개의 다른 클래스들 중 어느 것이 었습니다 팬더를 사용한 일반적인 접근 방식을 사용하여로드합니다 클래스 유형 필드는 마지막 열에 있으며, 그것이 우리가 예상하는 칼럼입니다

과거에는 데이터를 손으로 섞어서 나누었습니다 우리가 여기서 볼 수 있듯이 팬더를 사용합니다 이제는 scikit-learn이 통합되었으므로 실행하지 않겠습니다 이 모든 작업을 하나의 기능으로 그것들은 단지 너무 일반적으로 사용되기 때문에, train_test_split이라고합니다 교육 및 테스트 데이터 작성을 담당합니다

귀하의 기능과 라벨을 위해 이것들의 모양이 우리가 예상했던 것과 똑같은 것을 볼 수 있습니다 기본값은 데이터의 25 %를 사용하는 것입니다 나머지 75 %는 교육을받습니다 Support Vector Classifier 또는 SVC를 사용합니다

이 예제에서 하지만이 기계를 다른 기계로 쉽게 교체 할 수 있습니다 학습 알고리즘 다음으로, 우리는 그것에 적합하다고 부를 것이다 기차와 정말 같습니다

그런 다음 score를 호출하여 모델 성능을 평가합니다 마지막으로 몇 가지 예제를 시도하기 위해 예측을 호출합니다 보시다시피 scikit-learn에는 실제로 매핑되는 API가 있으며, 개념적 워크 플로와 정말로 비슷하게, 사용하기 쉽습니다 그래서 이것은 매우 단순하고 빠른 모양이었습니다

scikit-learn을 통합하는 방법 우리가 해왔 던 기존 작업 중 일부로 하지만 당신이 훨씬 더 많이 할 수 있다는 것을 압니다 자습서와 문서를 살펴보고, 멋진 모델을 만들 수 있습니다 다음에는 기계 학습의 다른 측면에 대해 이야기하겠습니다 scikit-learn으로 예측하기 그리고 그것을 확장하는 방법 클라우드 AI 모험 에피소드를 시청 해 주셔서 감사합니다

그리고 그것을 즐긴다면, 그것을 좋아하십시오 모든 최신 에피소드를 바로 구독하려면 구독하십시오 그들이 나올 때 그리고 기계 학습의 광대 한 세계를 탐험하는 것을 잊지 마십시오 scikit-learn이 제공해야하는 모델, 모두 간단하고 깨끗한 API를 사용합니다

Bringing AI and machine learning innovations to healthcare (Google I/O ’18)

[음악 재생] 릴리 펭 : 안녕 모두들 내 이름은 릴리 펭이야

나는 의사로서 훈련을하고 있으며 나는 Google 의학에 종사하고있다 잘, Google 인공 지능 건강 관리 팀 저는 제품 매니저입니다 그리고 오늘 우리는 몇 가지 프로젝트에 대해 이야기 할 것입니다 우리 그룹에서 우리가 해왔 던 그래서 처음에는, 당신이 많은 것을 얻을 것이라고 생각합니다

그래서 나는 이것을 너무 많이 지나치지 않을 것입니다 그러나 우리는 깊은 학습을 적용하기 때문에 의료 정보에, 나는 원하는 종류의 조금만 사용되는 몇 가지 용어를 정의하는 것 그러나 다소 불충분하게 정의됩니다 그래서 처음으로, 인공 지능 – 이것은 꽤 광범위한 용어이며 그 거대한 프로젝트를 포함합니다 비인간적 인 지능을 구축한다 기계 학습은 특별한 유형입니다 인공 지능에 대해서, 그것은 더 똑똑해질 수있는 기계를 가르치고 있습니다

그리고 깊은 학습은 특별한 유형입니다 너희들 기계 학습의 아마 꽤 많이 들었고 꽤 많이 들었습니다 우선 무엇보다 깊은 학습이란 무엇입니까? 그래서 인공 신경 네트워크의 현대 환생입니다 실제로 1960 년대에 발명되었습니다 그것은 조직 된 단순한 훈련 가능한 단위의 모음입니다 레이어에서

그리고 그들은 함께 작업하여 복잡한 작업을 해결하거나 모델링합니다 따라서 일반적으로 데이터 세트가 작고 계산이 제한적일 경우, 우리가 1980 년대와 90 년대에 가진 것입니다 일반적으로 다른 접근 방식이 효과적입니다 그러나 더 큰 데이터 세트 및 더 큰 모델 크기 더 많은 컴퓨팅 성능을 제공한다면, 우리는 신경 네트워크 훨씬 더 잘 작동합니다 실제로 두 가지 테이크 아웃이 있습니다

너희들이이 슬라이드에서 나가길 바란다 하나는 깊은 학습 열차 알고리즘입니다 충분한 데이터가 주어지면 매우 정확합니다 두 가지, 깊은 학습이 이것을 할 수 있습니다 기능 공학없이 그리고 그것은 명시 적으로 규칙을 쓰지 않고 의미합니다 그럼 그게 무슨 뜻이야? 글쎄, 전통적인 컴퓨터 비전에서, 우리는 규칙을 쓰는 데 많은 시간을 할애한다

특정 예측 작업을 수행하기 위해 기계가 따라야한다는 것을 의미합니다 길쌈 신경 네트워크 (convolutional neural networks) 우리는 실제로 기능에 거의 시간을 소비하지 않습니다 이러한 규칙을 작성하고 작성합니다 우리가 데이터 준비에 소비하는 대부분의 시간 수치 최적화 및 모델 아키텍처 그래서 나는이 질문을 꽤 많이 받는다

그리고 문제는 얼마나 많은 데이터가 충분한 데이터인지입니다 깊은 신경 네트워크? 일반적으로 더 많은 것이 좋습니다 그러나 특정 시점을 넘어선 수익이 감소하고 있습니다 일반적인 경험 법칙은 클래스 당 약 5,000 개의 긍정적 인 것을 좋아합니다 그러나 중요한 것은 좋은 관련 데이터입니다

쓰레기통에, 쓰레기통 이 모델은 예측하기 위해 무엇을 요구 하는지를 매우 잘 예측합니다 그래서 당신이 기계 학습을 어디에서 생각하는지, 특히 깊은 학습은 가장 큰 영향을 미칠 수 있습니다 실제로 장소에 있습니다 살펴볼 많은 데이터

우리 이사 중 한 명인 Greg Corrado가 최선을 다합니다 깊은 학습은 당신이 해낸 일에 정말 좋습니다 시간, 그리고 10,001 번째 시간에, 당신은 단지 그것의 아플 뿐이에요 더 이상하고 싶지 않아 그래서 이것은 검진에서 건강 관리에 정말 좋습니다

많은 환자를 볼 수있는 응용 프로그램 잠재적으로 정상입니다 전문 기술이 제한되어있는 곳에서도 좋습니다 오른쪽에 그래프가 나타납니다 세계 각국의 방사선과 의사 부족의 부족 그리고 이것은 다른 의학 전문 분야에도 해당됩니다

그러나 방사선과 의사가 여기 있습니다 그리고 우리는 근본적으로 의료 전문 지식의 세계적 부족을 봅니다 그래서 심사 신청 중 하나 우리 그룹이 당뇨병 성 망막증을 앓고 있습니다 더 쉽기 때문에 우리는 이것을 DR이라 부릅니다 당뇨병 성 망막증보다

그리고 예방 가능한 실명의 가장 빠른 성장 원인입니다 당뇨병 환자는 모두 4 억 5 천만 명에 달합니다 1 년에 한 번 상영됩니다 이것은 뒤의 사진을 찍음으로써 이루어진다 특별한 카메라로 눈의 모습을 볼 수 있습니다

그리고 그림은 그 것처럼 조금 생겼습니다 의사가 이런 이미지를 얻을 때 의사가하는 일 질병없이 1에서 5 단계로 등급을 매기 는가, 건강하고, 질병을 번식시키고, 그것은 마지막 단계입니다 그리고 그들이 등급을 매길 때, 때로는 매우 미묘하게 보입니다 결과, 미세 동맥류라고하는 작은 것들 그것은 눈의 혈관에 outpouchings입니다 그리고 그것은 당뇨병이 얼마나 안 좋은지를 나타냅니다

당신의 비전에 영향을 미치고 있습니다 그래서 불행히도 세계의 많은 지역에서, 이 일을하기에 안과 의사가 충분하지 않습니다 그래서 인도에있는 한 파트너와 함께, 또는 실제로 인도에있는 우리의 파트너 몇, 전국에 127,000 명의 안과 의사가 부족합니다 결과적으로 환자의 약 45 % 질병이 감지되기 ​​전에 시력 손실의 일종을 겪는다 네가 회상 한대로이 질병이 완전히 예방할 수있었습니다

다시 한번 이것은 일어나서는 안되는 것입니다 그래서 우리가하기로 결심 한 것은 우리가 파트너가 된 것입니다 인도에 몇 군데 병원을두고, 미국의 선별 서비스 제공 업체입니다 그리고 우리는이 첫 번째 시도에 대해 약 130,000 개의 이미지를 얻었습니다 우리는 54 명의 안과 의사를 고용하고 라벨링 도구를 만들었습니다

그리고 54 명의 안과 전문의는 실제로 이 스케일에서이 이미지의 등급을 매겼는데, DR에서 증식으로 흥미로운 점은 실제로 의사가 이미지를 호출하는 방법에 약간의 변동성이 있습니다 그래서 우리는 실제로 약 880,000 건의 진단을 받았습니다 이 레이블이 지정된 데이터 세트를 사용하여 알려진 콘볼 루션 신경망 이것은 시작이라고합니다

나는 너희들 중 많은 사람들이 그것에 익숙하다고 생각한다 일반적으로 사진 앱을 위해 고양이와 개를 분류하는 데 사용됩니다 또는 다른 검색 애플 리케이션을 위해 그리고 우리는 그저 안저 영상을 재사용했습니다 그래서 우리가 배운 다른 것 우리가이 일을하는 동안 그게 정말 유용했던 동안 이 5 점 진단, 그것은 또한 믿을 수 없을만큼 의사에게 유용하다

이미지 품질과 같은 하우스 키핑 예측에 대한 피드백, 이것이 왼쪽 눈인지 오른쪽 눈인지, 또는 이것이 망막의 어느 부분인지 알 수 있습니다 그래서 우리는 그것을 네트워크에도 추가했습니다 그럼 얼마나 잘하는거야? 이것이 우리 모델의 첫 번째 버전입니다 우리가 2016 년 의학 저널에 발표 한 내용은 제가 믿습니다 여기 왼쪽에는 차트가 있습니다

총계에있는 모형의 성과의 약 10,000 개 이상의 이미지 민감도는 y 축에 있고, 1 마이너스 특이성 x 축에있다 감도는 시간의 백분율입니다 환자가 질병에 걸렸다면 그 모델이 그 질병을 부르고 있었을 때, 맞았습니다 그리고 특이성은 비율입니다

모델에 질병이없는 환자들 또는 의사가 옳았다 그리고 당신은 뭔가를 원한다는 것을 알 수 있습니다 높은 민감도와 높은 특이성을 지니고 있습니다 그리고 위아래로 – 또는 위로 그리고 왼쪽으로 좋다 그리고 차트에서 여기를 볼 수 있습니다

작은 점들이 그 의사들이라고 동일한 세트를 채점하고있었습니다 그래서 우리는 의사와 매우 가까워졌습니다 그리고 이들은 보드 인증을받은 미국의 의사들입니다 그리고 이들은 안과 의사, 일반 안과 의사들입니다 훈련으로

사실 F 점수를 보면 감도와 특이성의 결합 된 척도이며, 우리는 중앙 안과 전문의보다 조금 나아졌습니다 이 특별한 연구에서 그래서 그 이후로 우리는 모델을 향상 시켰습니다 그래서 작년에 약 2016 년 12 월 우리는 일종의 동위에 있었다 일반인들과

그리고 올해는 – 이것은 우리가 발행 한 새로운 논문입니다 우리는 실제로 망막 전문가를 사용했습니다 이미지를 채점하기 위해 그래서 그들은 전문가입니다 우리는 또한 그들이 동의하지 않을 때 논쟁하도록했습니다

진단이 뭔지에 대해서 그리고 우리는 모델을 언제 사용 하는지를 볼 수 있습니다 그 사실을 근거로 모델은 매우 잘 예측했습니다 게다가 올해 우리는 일종의 동위에 있습니다

망막 전문가와 그리고이 가중 카파는 단지 5 수준의 합의 그리고 본질적으로 우리는 안과 의사와 망막 사이의 일종 사실 전문가들 사이에 망막 전문가 우리가 작업 해 왔던 또 다른 일 모델을 개선하는 것을 넘어서 실제로는 네트워크를 설명하려고 애쓰다 그것이 어떻게 예측을하고 있는지 다시 한번, 연극이나 연극을 가져 가라

소비자 세계의 플레이 북에서, 우리는 show me where라는 기술을 사용하기 시작했습니다 그리고 이것은 이미지를 사용하는 곳입니다 실제로 열 화상지도를 생성합니다 관련 픽셀은이 특정 예측을위한 것입니다 그래서 여기 포메라니스트의 그림을 볼 수 있습니다

그리고 히트 맵은 거기에 당신을 보여줍니다 포메 라니아 사람의 얼굴에있는 무언가이다 그것은 Pomeranian-y를 보게합니다 그리고 여기 오른쪽에는 아프간 인의 사냥개가 있습니다 그리고 네트워크는 아프간 인 사냥개를 강조했다

그래서 이와 비슷한 기술을 사용하여, 우리는이를 안저 이미지에 적용했다 우리가 말했지, 어디 있는지 보여줘 이것은 가벼운 질병의 경우입니다 그리고 나는 가벼운 질병이라고 말할 수 있습니다 왜냐하면 – 잘, 그것은 나에게 완전하게 정상적으로 보인다

나는 거기에 어떤 질병이 있다고 말할 수 없다 하지만 고도로 숙련 된 의사라면 미세 동맥류 라 불리는 작은 것을 골라 낼 수있다 녹색 지점이있는 곳 다음은 중등도의 질병 사진입니다 그리고 이것은 당신이 볼 수 있기 때문에 조금 더 나쁩니다

여기 끝에 약간의 출혈 그리고 실제로 나는 신호 할 수 있는지, 하지만 거기에 피가 나옵니다 그리고 열지도 – 히트 맵이 있습니다 출혈을 일으킨다는 것을 알 수 있습니다 그러나이 이미지에는 두 가지 유물이 있습니다

그래서 작은 얼룩처럼 먼지가 있습니다 그리고이 작은 반사가 있습니다 이미지의 중간에 그리고 당신은 그 모델이 근본적으로 그것을 무시합니다 그럼 다음은 뭐니? 우리는 모델을 훈련 시켰습니다

우리는 다소 설명 할 수 있음을 보여주었습니다 우리는 그것이 올바른 일을한다고 생각합니다 무엇 향후 계획? 음, 우리는 실제로 의료 시스템에 이것을 배치해야합니다 우리는 의료 공급자와 제휴하고 있습니다 그리고 회사는이를 환자에게 제공해야합니다

실제로 제게 메가 박사님, 누가 저를 대담하게 말할 것입니까? 이 노력에 대해 좀 더 자세히 설명 할 것입니다 그곳에 그래서 심사 신청서를 제출했습니다 그리고 여기 진단의 응용이 있습니다 우리가 작업하고있는 그래서이 특별한 예에서 우리는 질병에 대해 이야기하고 있습니다

우리는 유방암에 대해 이야기하고 있습니다 그러나 우리는 유방암의 전이에 대해 이야기하고 있습니다 근처 림프절로 따라서 환자가 유방암 진단을 받았을 때 원발성 유방암이 제거되면, 외과의 사는 밖으로 약간 시간을 보낸다 우리가 림프절이라고 부르는 것을 조사 할 수 있도록 유방암이 전이되었는지 아닌지보기 그 노드들에게 그리고 그것은 환자를 어떻게 대하는가에 영향을 미칩니다

이 림프절을 읽는 것은 쉬운 일이 아닙니다 그리고 실제로 그들이 돌아올 때의 생체 검사의 약 24 % 그들을보기 위해, 24 %는 마디 상태의 변화를 가지고 있었다 이는 긍정적 인 경우 부정적인 것으로 읽음을 의미합니다 그리고 그것은 음성적이었고, 긍정적이었습니다 그래서 그것은 정말로 큰 문제입니다

4 분의 1에요 흥미로운 점은 다른 연구 결과에 따르면 무한한 시간을 가진 병리학 자, 실제로 데이터에 압도 당하지 않았다 매우 민감하기 때문에 94 %의 감수성 종양 환자에게 시간 제약을 가하면, 그들의 감수성 – 또는 미안, 공급자에, 병리학 자에게는 감도가 떨어집니다 그리고 사람들은 내려다보기 시작할 것입니다

거의 전이가 없을 수도 있습니다 그래서이 그림에 바로 거기에 작은 전이가 있습니다 그리고 그것은 보통 놓친이 작은 것들입니다 많은 정보가 주어지면 놀랍지도 않습니다 각 슬라이드에 있습니다

따라서 이러한 슬라이드 중 하나가 디지털화 된 경우, 약 10 기가 픽셀입니다 그리고 그것은 말 그대로 건초 더미에있는 바늘입니다 흥미로운 점은 병리학 자들이 실제로 그들이 자신의 모든 시간을 보면서 암의 73 %를 찾는다 슬라이드마다 오진 (false positive)이 발생합니다 그래서 우리는이 작업을 도울 수있는 모델을 교육했습니다

실제로 암 병변의 약 95 %를 찾습니다 슬라이드 당 8 개의 가양 성이 있습니다 그래서 이상적인 시스템은 분명히 하나입니다 모델을 사용하여 매우 민감하지만 매우 구체적입니다 병리학자를 실제로 훑어 보는 것에 의존하는 거짓 긍정 (false positive)과 오탐 (false positive)이라고합니다 그래서 이것은 매우 유망하며 우리는 지금 클리닉에서 유효성 검사를하고 있습니다

독자 연구의 관점에서, 이것이 실제로 어떻게 의사와 상호 작용하는 것은 정말로 중요합니다 그리고 분명히 다른 조직에 응용할 수 있습니다 나는 림프절에 관해 이야기했지만 초기 연구가있었습니다 실제로 이것은 전립선 암에서 효과가 있음을 보여줍니다 글리슨 그레이딩에 대해서도 마찬가지입니다 그래서 이전 예제에서 우리는 말했습니다

얼마나 깊이있는 학습이 매우 정확합니다 그리고 그들은 의사가 이미 만들었던 전화를하는 경향이 있습니다 그러나 의사가 현재하지 않는 것들을 예측하는 것은 어떨까요? 이미징에서 할거야? 그래서 당신이 이야기의 처음부터 기억하고 있듯이, 깊은 학습에 대한 위대한 것들 중 하나 매우 정확한 알고리즘을 훈련시킬 수 있다는 것입니다 명시 적으로 규칙을 작성하지 않아도됩니다 그래서 우리는 완전히 새로운 발견을 할 수 있습니다

그래서 왼쪽 그림은 종이에서 나온 그림입니다 우리가 최근에 출판 한 다양성을 예측하는 훈련 된 심층 학습 모델 의 심혈관 위험 요인 여기에는 나이, 자기보고 섹스, 흡연 상태, 혈압, 일반적으로 의사들 환자의 심장 혈관 위험을 평가하기 위해 지금 고려해보십시오 적절한 치료 권고를하십시오 그래서 우리는 우리가 이러한 요소 중 많은 것을 예측하고, 매우 정확하게, 실제로 5 년 위험을 직접 예측할 수 있습니다

심장 사건의 그래서이 연구는 아주 일찍, 정말 폐활 적이었고, 이 예측을위한 AUC는 07이다 이 숫자가 의미하는 것은 두 장의 그림이 주어지면 심혈관 사건이없는 환자의 사진 그리고 한 환자의 사진은 약 70 % 그 시간의 대부분의 의사들은 약 50 %의 시간을 보냈고, 그것은 무작위 적이기 때문에 – 마치 혼자 망막 이미지를 기반으로하기가 어렵습니다 그렇다면 왜 이것이 흥미로운가? 일반적으로 의사가 시도 할 때 심혈관 질환 위험을 평가하기 위해, 관련된 바늘이 있습니다

그래서 나는 누군가가 혈중 콜레스테롤을 섭취했는지 모른다 상영 전에 밤에 금식하고 혈액 샘플을 가져가 그런 다음 위험을 평가합니다 다시 한번, 저는 이것이 정말로 초기에 있다는 것을 강조하고 싶습니다

그러나 이러한 결과는 아이디어를 뒷받침합니다 우리가 뭔가를 사용할 수 있을지도 몰라 우리가 할 수 없었던 새로운 예측을하기 위해 이미지처럼 전에 만들어라 그리고 이것은 정렬로 수행 될 수 있습니다 비 침습적 인 방식으로

그래서 몇 가지 예를 들어 보았습니다 세 가지 예가 있습니다 얼마나 깊은 학습이 실제로 두 가지 가용성을 증가시킬 수 있는지 건강 관리의 정확성 그리고 내가 원하는 종류의 것들 중 하나 이것이 여기에있는 이유가 여기에 있음을 인정하십시오 TensorFlow는 점점 더 흥미 진진합니다

오픈 소스입니다 일반적인 기계 학습에서 이런 종류의 개방형 표준 어디서나 적용되고 있습니다 그래서 저는 Google에서 한 일의 예를 들었습니다 커뮤니티 전체에서 수행되는 많은 작업이 있습니다 매우 유사한 다른 의료 센터에서

그래서 우리는 무엇에 대해 정말 흥분하고 있습니다 이 기술은 건강 관리 분야에 도움이 될 수 있습니다 그리고 그걸로 Jess Mega를 소개하고 싶습니다 저와 달리, 그녀는 진짜 의사입니다 그리고 그녀는 Verily의 최고 의료 책임자입니다

제시카 메가 : 여기에와 주셔서 감사합니다 그리고 우리를 걷어차 기 위해 릴리에게 감사드립니다 나는 AI와 건강 관리에 대한 흥분을 생각한다 더 커질 수는 없다 들으 셨던 것처럼, 제 이름은 메스 제스입니다

나는 심장 전문의이고, 너무 기쁘다 알파벳 가족의 일부입니다 Verily는 Google과 Google X에서 성장했습니다 그리고 우리는 전적으로 의료 및 생명 과학에 중점을두고 있습니다 우리의 사명은 세계의 건강 정보를 취하는 것입니다

환자가보다 건강한 삶을 누릴 수 있도록 유용하게 만듭니다 그리고 오늘 제가 이야기 할 예제는 당뇨병에 초점을 맞추고 있습니다 릴리가 시작한 대화에 정말로 도움이됩니다 하지만 일시 중지하는 것이 매우 중요하다고 생각합니다 건강 데이터를 광범위하게 생각해보십시오

현재 청중에있는 모든 개인 약 몇 기가 바이트의 건강 데이터가 있습니다 그러나 수년 동안 건강에 관해 생각한다면 유전체학에 관해서 생각해보고, 분자 기술, 이미징, 센서 데이터, 환자보고 데이터, 전자 건강 기록 우리는 엄청난 액수에 대해 이야기하고 있습니다 데이터, 기가 바이트의 데이터 그리고 Verily와 Alphabet에서 우리는 우리가 환자들을 도울 수 있도록이 일에 앞장설 것입니다 우리가 초기에 우리의 노력 중 일부를 집중하고있는 이유 당뇨병에 이것은 긴급한 건강 문제입니다

약 10 명 중 1 명이 당뇨병을 앓고 있습니다 당뇨병에 걸릴 때 시체에서 설탕 포도당을 어떻게 다룰 지 그리고 당신이 prediabetes에 대해서 생각한다면, 누군가 당뇨병에 걸리기 전에 조건, 3 명 중 1 명입니다 오늘 청중의 전체 중앙 섹션이 될 것입니다 이제 몸이 처리 할 때 어떤 일이 발생합니까? 포도당은 다른 방법으로, 당신은 다운 스트림 효과를 가질 수 있습니다

릴리가 당뇨병 성 망막증에 대해 이야기하는 것을 들었습니까? 사람들은 심장, 신장, 말초 신경 병증 이것이 우리가 앞서 나아갈 필요가있는 질병의 유형입니다 그러나 우리는 우리가 다루려고하는 두 가지 주요 쟁점을 가지고 있습니다 첫 번째는 정보 격차입니다 따라서 당뇨병 환자 중 가장 견고한 환자들조차도 – 우리 할아버지는이 중 하나 였어

하루에 네 번씩 혈당을 확인합니다 오늘이 누구인지 모르겠다 어떤 간식을 먹을 수 있습니다 나는 캐러멜 팝콘을 실제로 가지고 있었다 누구든지 그 중 하나가 있었나요? 그래, 대단하다

우리의 생물학과 우리의 포도당은 위아래로 가고 있습니다 그래서 제가 그 순간에 포도당을 검사하지 않으면, 우리는 그 데이터를 포착하지 못했을 것입니다 그래서 우리는 생물학이 항상 일어나고 있다는 것을 압니다 심장병 전문의로 병원에있는 환자를 볼 때, 나는 누군가의 심장 박동수, 혈압, 모든 것을 볼 수있다 이 생체 신호 중 실시간으로 그리고 사람들은 집으로 돌아가지만 생물학은 여전히 ​​일어나고 있습니다

따라서 정보 격차가 있습니다 특히 당뇨병 환자와의 차이 두 번째 쟁점은 의사 결정 갭입니다 1 년에 1 회, 1 년에 2 회, 그러나 매일 건강에 대한 결정이 내려지고 있습니다 그들은 매주, 매일, 매시간 일어나고 있습니다

그리고 우리는 어떻게이 격차를 좁히기로 결정합니까? 진실로 우리는 세 가지 핵심 사명에 집중하고 있습니다 그리고 이것은 거의 모든 프로젝트에 적용될 수 있습니다 우리는 교대하는 법을 생각하고 있습니다 에피소드 및 반응 치료에서 훨씬 예방적인 치료에 이르기까지 다양합니다 그리고 그 일을하고 요점을 이해하기 위해 우리는 실제로 AI의 힘을 사용할 수 있습니다

우리는 세 가지를해야합니다 올바른 데이터를 수집하는 것에 대해 생각해야합니다 그리고 오늘 저는 지속적인 포도당 모니터링에 대해 이야기 할 것입니다 그런 다음이 데이터를 어떻게 구성하여 형식으로되어 있는지 확인하십시오 우리는 환자의 잠금을 해제하고 활성화하여 진정으로 도움을 줄 수 있습니까? 그래서 우리가 당뇨병 분야에서 이것을 행하는 지 여부 오늘 또는 우리의 수술 로봇에 대해 듣게 될 것입니다

이것은 일반적인 전제입니다 생각할 첫 번째 사항은 데이터 수집입니다 그리고 릴리가 쓰레기를 말하면서, 쓰레기가 나옵니다 이해하지 못하면 통찰력을 찾을 수 없습니다 우리가보고있는 것

그리고 절대적으로 혁명적 인 한 가지 매우 작은 생체 적합성에 대해 생각하고있다 전자 제품 따라서 우리는 차세대 감지 기술을 연구하고 있습니다 그리고 여기에서 데모를 볼 수 있습니다 이것이 예를 들어, 매우 작은 연속 포도당 모니터가있는 곳에서 이러한 도구 중 일부를 만들기 위해 협력하고, 이것은보다 매끄러운 통합으로 이어질 것입니다

다시 한번, 당신은 단지 포도당 값이 얼마되지 않습니다 그러나 우리는 당신 몸이 어떻게 취급하고 있는지 이해합니다 설탕, 제 2 형 당뇨병 환자, 보다 지속적인 방식으로 그것은 또한 우리가 인구 수준에서 일어나는 일 그러나 개인적인 차원에서 일어날 수있는 일 특정 음식을 섭취 할 때 그리고 마지막으로 장치 비용을 줄이려고 노력합니다 그래서 우리는 건강을 정말로 민주화 할 수 있습니다

다음 목표는이 모든 데이터를 어떻게 구성 할 것인가입니다 그리고 저는 환자와 의사로서 말할 수 있습니다 사람들이 말할 수있는 것은 데이터가 놀랍고, 쓰나미로 데이터를 압도하지 마십시오 당신은 그것을 조직해야합니다 그래서 우리는 사노피와 파트너십을 맺었습니다

Onduo라는 회사에서 그리고 그 생각은 환자를 그들의 보살핌과 도움의 중심에 당뇨 관리를 단순화합니다 이것은 정말 누군가의 마음에 도착합니다 누가 더 행복하고 건강해질 것인가 그렇다면 실제로 무엇을 의미합니까? 우리가하려는 일은 사람들에게 힘을 실어주는 것입니다 그들의 포도당 제어와 함께

그래서 우리는 미국 당뇨병 협회 권장 포도당 범위를 살펴보십시오 그러면 사람들이 당신에게 보여주는 그래프를 얻습니다 하루의 모습과 시간의 비율 너는 범위 안에있다 다시, 환자 또는 사용자에게 제공 그 데이터는 그들이 결정의 중심이 될 수 있도록 – 마지막으로 Google 피트니스를 통해 단계를 추적합니다 다음 목표는 이해하려고 노력하는 것입니다

포도당이 당신의 활동과식이 요법과 어떻게 조화를 이루고 있는지 여기에는 프롬프트를 표시하는 앱이 있습니다 음식 사진 그리고 이미지 인식을 사용하고 Google의 TensorFlow를 사용하여, 우리는 음식을 식별 할 수 있습니다 그리고 이것이 진정한 개인적 통찰력이있는 곳입니다

진짜가되기 시작하십시오 왜냐하면 당신이 특정 식사를 먹으면, 몸이 어떻게 끝나는 지 이해하는 것이 도움이됩니다 그것과 관련있다 그리고 흥미로운 예비 자료가 있습니다 미생물이 변할 수 있음을 시사한다

내가 바나나에 반응 한 방식, 예를 들면, 그렇지 않으면 응답 할 수 있습니다 그리고 그것은 모두가 중요하기 때문에 중요합니다 우리가 만드는 일반적인 권고 사항이 갑자기 의사로서 누군가 나를 클리닉에서 보러 오면 2 형 당뇨병이 있습니다

여기 당신이해야 할 일들이 있습니다 당신은 당신의 다이어트, 운동, 구두 약을 복용하십시오 인슐린, 운동도 받아야합니다 당신은 당신의 발 의사, 당신의 눈을보아야 만합니다 의사, 주치의, 및 endocrinologist

그리고 그것은 통합 할 것이 많습니다 그래서 우리가하려고하는 것은 쌍입니다 이 모든 정보는 간병과 함께 간단한 방법으로 제공됩니다 이 여행을 돕는 사람입니다 이 정보가 떠오르면 내가 여기서 너에게 보여준 것의 가운데를 들여다 보면 의료지도와 그 사람이 보는 것, 당신은 여러 다른 라인을 볼 수 있습니다

드릴 다운하고 살펴보기를 바랍니다 이것은 데이터 간의 차이점을 보여줍니다 에피소드 식 포도당 예제에서 볼 수 있습니다 또는 지속적인 포도당 모니터로보고있는 것 이 새로운 감지로 가능합니다 그리고 우리가이 연속 포도당을 뚫어 말하며 모니터하고 우리는 일의 클러스터를 봅니다

이것은 하나의 예입니다 우리는 패턴을보기 시작할 것입니다 릴리가 언급했듯이 이것은 유형의 것이 아닙니다 개별 환자, 간병인 또는 의사가 파고 있지만, 여기가 당신은 학습 모델의 힘을 풀기 시작합니다 우리가 볼 수있는 것은 클러스터입니다

다른 아침의 우리는 긍정적 인 연관성을 만들거야 모두가 여기에서 믿을 수 없을만큼 건강하게 먹는다고 Google I / O에서 빨간색 아침의 클러스터가 될 수도 있습니다 하지만 우리는 일상 생활로 돌아가서 스트레스를받습니다 우리는 다른 종류의 음식을 먹고 있습니다

그러나 대신에, 일반적인 조언을하는 대신에, 우리는 다른 모델을 사용하여 지적 할 수 있습니다 뭔가 진행되고있는 것처럼 보입니다 예를 들어 환자 한 명과 수요일 즈음에 군집이 보였다 그래서 수요일에 무슨 일이 일어나고있는거야? 그 사람이 가고 멈추고 있는가? 특정 위치 또는 어쩌면 거기에 있습니다 그날 많은 스트레스

그러나 다시 한번, 일반적인주의를 기울이지 않고, 가장 포괄적 인 방법으로 치료를 시작할 수 있습니다 실용 가능한 예 다시 한번 우리가 말하는 것에 대해 생각해보십시오 데이터 수집, 구성 및 활성화 매우 관련성이 높습니다 이것이 우리가 당뇨병 관리에 관해 생각하는 방식입니다

이것이 바로 AI가 작동하는 방식입니다 우리는 오늘 아침 다른 토론에서 들었습니다 우리는 문제에 대해 생각해 봐야 해 우리는 이러한 도구를 사용하여 실제로 만들 것입니다 차이

그래서 우리가 생각할 수있는 다른 방법은 무엇입니까? 정보 활성화에 대해서? 그리고 릴리에게서 당뇨병 성 망막증 실명의 주요 원인 중 하나입니다 우리가 뛰어난 포도당 관리를하더라도, 말기 장기 손상이 시작될 수도 있습니다 그리고 나는 그 상승 된 포도당을 언급했다 레벨이 결국 안저 및 망막에 영향을 줄 수 있습니다 이제 당뇨병 환자들 심사를 받아야합니다

하지만 이전에 내가 너에게 준 이야기에서 우리가 환자에게 묻는 것의 세탁 목록 당뇨병에 걸린 사람 그래서이 공동 작업으로 우리가하려는 일은 구글과 함께, 어떻게 우리가 실제로 제품을 앞서 생각하고 생각하다 우리가 실현할 수 있도록 엔드 – 투 – 엔드 솔루션에 대해 오늘날 존재하는 어려움을 제거하십시오 이 문제는 상영에 관한 한 그 중 하나이기 때문에 내게 필요한 옵션이며 다른 하나는 검안의와 안과 의사에게 접근 할 수 있습니다

그리고 이것은 미국의 문제입니다 개발 도상국 에서뿐만 아니라 그래서 이것은 단지 문제가 아니라 지역적 문제입니다 이것은 우리가 매우 세계적으로 생각할 때입니다 우리는 해결책에 대해 생각합니다 우리는이 데이터를 일찍이 생각해 보았습니다

우리는 알고리즘을 사용할 수 있고 두 감도 모두를 높일 수 있습니다 당뇨 망막 병증의 진단과 특이도 황반부 종 그리고 이것은 "JAMA"에 게시 된 데이터입니다 릴리가 잘 설명했듯이 그렇다면 우리는 어떻게 생각할 것인가? 이 제품을 만드는 방법에 대해? 알파벳 같은 장소에서 일하는 것의 아름다움 오늘 당신과 같은 파트너와 함께 일하는 것이 우리 모두입니다

생각할 수있는 것, 우리가 해결해야 할 문제가 무엇인지, 알고리즘을 작성하십시오 그러나 우리는 그 때 뒤로 물러 설 필요가있다 보건 분야에서 활동한다는 의미 그리고 생명 과학의 공간에서? 우리는 이미지 획득, 알고리즘, 그 정보를 전달하는 것 의사뿐 아니라 환자에게도 도움이됩니다 우리가하는 일은이 정보를 취하는 것입니다 현재 일부 파트너와 협력하고 있습니다

현재 유망한 파일럿이 있습니다 인도에서와 마찬가지로, 우리는 듣고 싶습니다 이른 피드백 그리고 두 가지 정보가 있습니다 나는 너와 나누고 싶었다

하나는이 초기 관측을보고, 우리는 AI로 더 높은 정확도를보고 있습니다 더 큰 매뉴얼보다 의사로서 중요한 것은 – 방에 다른 의사가 있는지 나는 모른다 하지만 내가 항상 사람들에게 말하는 부분은 건강 관리 제공자를위한 공간이 될 것입니다 이 도구들이하는 일은 단지 우리가 일하는 것을 돕는 것입니다

그래서 때로는 사람들이 나에게 묻습니다 기술과 인공 지능입니다 의사를 대신하거나 의료 제도를 대체 할 것인가? 그리고 제가 생각하기에 그것은 단지 작품을 증대시키는 것입니다 우리는하다 청진기에 대해 생각한다면 – 그래서 저는 심장 전문의이고 청진기입니다

약 200 년 전에 발명되었습니다 우리가하는 일을 대체하지는 않습니다 그것은 단순히 우리가하는 일을 보강합니다 그리고 나는 우리가 계속하는 것과 비슷한 주제를 보게 될 것이라고 생각합니다 더 많은 것을 돌보는 방법에 대해 생각해보십시오

환자에게 효과적인 방법 그래서 여기서 가장 먼저 AI가 더 잘 수행되고 있다는 것입니다 수동 그레이더보다 그리고 두 번째로 생각하는 것입니다 그 환자 기초에 대해서

우리는 어떻게 진료를 진정으로 민주화합니까? 그리고 조종사에게서 다른 격려하는 조각 우리가 시작할 수있는 아이디어였다 알고리즘으로 치료받는 환자의 기반을 증가시킨다 이제 밝혀 졌을 때, 나는 좋아할 것입니다 건강하게 모든 것을하는 것이 정말 쉽다는 것을 말하고 있습니다 간호 및 생명 과학

그러나 그것이 나왔던 것에 따라, 그것은 거대한 마을을 필요로한다 이런 종류의 일을하는 것 그럼 다음은 뭐니? 임상 입양의 경로는 무엇입니까? 그리고 이것은 이것이 대단히 흥미로 웠습니다 많은 재능있는 기술자들과 일하는 의사가 되라 및 엔지니어 우리는 이제 다른 임상 사이트와 파트너가되어야합니다

나는 여기서 언급했다 우리는 또한 FDA, 유럽 ​​및 그 밖의 규제 기관들도 마찬가지입니다 우리가하기로 결정한 진실로 한 가지 FDA 사전 인증이라고 불리는 것에 속하는 것입니다 프로그램 우리는 새로운 기술과 새로운 알고리즘 의료 보험에 가입하는 것이 중요하지만 지금은 그 방법을 알아 내야합니다

둘 다 안전하고 효과적입니다 그리고 저는 Alphabet에서 우리를 자랑스럽게 생각합니다 앞서 나가고 파트너 관계를 유지하십시오 FDA와 같은 단체들과 주의해야 할 두 번째 사항 우리가 진실로 진실로 Google 및 Nikon 및 Optus와 같은 다른 파트너와 함께 이 모든 것들이 모여 든다 진료를 변형시키려는 시도

그러나 나는 이것이 올바르게하면, 당뇨병뿐만 아니라 실제로 큰 기회가 있습니다 건강 정보의 전 세계에서 그것에 대해 생각하는 것은 흥미 롭습니다 내 시간을 대부분 보살 피는 의사로서 병원에있는 환자의 보살핌에 더 많은 접근을 시작하십시오 병원 밖에서? 하지만 우리가 잘한다면 우리가 앞서 나가면이 격차를 좁힐 수 있습니다 더 예방적인 방법을 찾아 낼 수 있습니다

우리는 올바른 정보를 수집 할 수 있습니다 우리는 인프라를 구성하여이를 구성 할 수 있습니다 그리고 가장 중요한 것은 그것을 활성화하는 방법을 알아낼 것입니다 그러나 나는 모두가 여기에서 알고 싶어한다 이것은 우리가 홀로 할 수있는 일이 아닙니다

정말로 우리 모두를 필요로합니다 그리고 Verily, 우리는 Google에, 우리는 Alphabet 여러분 모두와 함께 할 수 있기를 기대합니다 그래서이 여행에서 우리를 도와주세요 이 대화 후에 릴리와 나는 여기있을 것이다 우리는 여러분 모두와 행복하게 대화 할 수 있습니다

I / O에서 시간을내어 주셔서 감사합니다 [음악 재생]

Deep Learning Images for Google Compute Engine

[음악 재생] VIACHESLAV KOVALEVSKYI : 안녕하세요 오늘은 깊은 학습 이미지에 대해 이야기하겠습니다

Google Compute Engine 용 그리고 이것은 흥미로운 주제입니다 그리고이 주제의 본질은 흥미 롭습니다 많은 모임과 많은 활동 활동이 끝날 때까지 보여주는 방법 새롭고 멋진 것을 만들어야합니다 그러나 깊은 학습 이미지는 도구이며, 자신의 프로젝트에서 사용해야하는 도구 아마 오늘 우리는 가지 않을거야

당신이 만들 수있는 특별한 멋진 것들을 망라합니다 나는이 도구를 설명하려고 노력할 것이다 그리고 사람들이 어떻게 활용하는지 알게 되길 바랍니다 이 도구는 자신의 프로젝트에 있습니다 그래서 우리가 깊은 학습 이미지에 대해 말할 것 인 동안, 때때로 나는 다른 명령을 사용할 것이다

일할 때 내 삶을 단순하게 해준다 깊은 학습 이미지와 실제로는 Google Compute 엔진 이것은 GitHub 페이지의 링크입니다 정확히 모든 명령이 있습니다 오늘 내가 보여줄 것입니다

이 링크는 Meetup의 후속 조치 노트에 있습니다 그래서 랩톱을 가지고 있지 않고 그것을 쓰고 싶지 않다면 지금은 절대적으로 괜찮습니다 이것은 설문 조사의 QR 코드입니다 하지만 조금 후에 설문 조사를하겠습니다 이 QR 코드가 다시 표시됩니다

하나의 주된 질문에 대답하면서 시작하겠습니다 깊은 학습 이미지 란 무엇입니까? 깊은 학습 이미지는 기본적으로 다른 VM 이미지 세트 깊은 학습을하기 위해 필요한 모든 것을 갖추고 있습니다 상자 밖으로 연구 몇 가지 핵심 사항이 있습니다 이것은 가상 시스템에 대한 하나의 이미지가 아닙니다

이것은 일련의 이미지입니다 우리는 실제로 서로 다른 이미지를 가지고 있습니다 이것은 모두를 설명하는 그래프입니다 그리고 우리는 나중에이 그래프로 돌아올 것입니다 그러나 요지는 단지 하나의 이미지가 아닙니다

두 번째 요점은 상자 밖에서 작동한다는 것입니다 그래서 그것은 무엇을 의미합니까? 그리고 그것이 실제로 중요한 이유는 무엇입니까? Bob을 만나 봅시다 그래서 Bob입니다 Bob은 깊은 학습을 원합니다 깊은 학습을하기 위해 그는 빌드하고 싶어합니다

자신 만의 가상 머신 깊은 학습에 필요합니다 그렇게하기 위해 Bob이 TensorFlow와 GPU를 사용하기를 원한다면, 그는 실제로 어떤 것을 알아 내야하는지 CUDA의 특정 버전은 TensorFlow에서 필요합니다 과거에 당신 중 누구라도 CUDA로 TensorFlow를 설정하려고 시도했지만, 당신은 아마 심지어 알아낼 수 있습니다 정확한 버전의 CUDA가 필요합니다 간단한 작업이 아닙니다

그건 그렇고, 얼마나 많은 사람들이 설치 했니? 로컬 컴퓨터에서 직접 GPU로 TensorFlow, Mac OS, 또는 구름에? 승인 꽤 많은 수 좋은 그래서 당신은 고통을 압니다 다음으로, 당신이 CUDA를 알아 내면, CUDA가 사용하는 정확한 드라이버를 알아야합니다

그리고 그 드라이버를 설치해야합니다 그런 다음 CUDA를 설치할 수 있습니다 그런 다음 CuDNN의 정확한 버전을 알아 내야합니다 TensorFlow가 필요하며 설치하십시오 그리고 NCCL은 TensorFlow 1

10부터 시작하여, 설치하지 않으면 실제로 작동하지 않습니다 올바른 NCCL 바이너리 그리고 마지막으로 TensorFlow를 설치할 수 있습니다 무언가 잘못되면 아마도 전혀 일하지 않을 것입니다 승인

자, Bob이 VM의 설정을 완료했다고 가정 해 봅시다 몇몇 GPU V100 설정은 다음과 같습니다 그래서 이것은 Bob의 정확한 설정입니다 완료, TensorFlow 1

9, CUDA 90, CuDNN 7, NCCL이 설치되지 않았습니다 합리적인 질문 – 이것이 가능한 최상의 구성인가? 그게 당신이 돈을 최대한 활용할 수있게 해줍니다 인스턴스를 지불하고 있습니까? 이제 기준선을 살펴 보겠습니다 그래서 이것은 속도의 기준선입니다

이것은 우리가 방금 Bob이 논의한 구성입니다 CuDNN 71 및 최신 NCCL로 전환하면, 10 %의 성능 향상 효과가 있습니다 원래 구성으로 가지고 있던 것의 위에 그래서 생각할지도 모릅니다

좋아요 최신 CUDA를 사용하십시오 최신 드라이버, 최신 CuDNN을 설치하고 잊어 버리십시오 그것은 나에게 최대의 성능을 줄 것이다 이 생각이 나타 났을지라도 CUDA 9

1이 출시되면 91이 실제로 느려지는 것을 볼 수 있습니다 TensorFlow 다운 그래서 최신의 것을 사용했다면, CUDA 91이 출시 될 무렵에는 최상의 구성을 사용하고 있지 않습니다

그리고 최신 92를 사용하고 있다면, 당신은 실제로 15 %의 성능 향상을 보입니다 승인 Bob이 실제로 이것을 어떻게 알 수 있습니까? 어떤 구성이 최선인지 그의 특별한 경우에요? 이것을 파악하려면 TensorFlow를 컴파일해야합니다 다른 CUDA를 사용하는 다른 방법은 없습니다

원본에서 컴파일하는 것을 제외하고는 공식 바이너리는 CUDA 90 기간만을 사용하고 있습니다 당신은 다른 것을 사용할 수 없습니다 그런 다음 특정 모델로 실험을 실행해야합니다

인스턴스에서이 새로운 TensorFlow 실제로 컴파일 한 파일은 후원 그리고 약 12 ​​개의 바이너리를 빌드해야합니다 세 가지 다른 CUDA가 있습니다 두 가지 다른 CuDNN이 있습니다 두 가지 NCCL 옵션이 있습니다

그리고 [? Anton 's?] Python 2, Python 3 사용에 관해 말하기 따라서 소스에서 컴파일해야하는 12 개의 바이너리 새로운 Nvidia 스택이 출시되면, 또는 새로운 TensorFlow가 출시되면 이 모든 것을 처음부터 시작해야합니다 성능은 실제로 새로운 스택으로 변경되기 때문입니다 그리고 이것은 정확하게 우리 팀이 플레이하는 곳입니다

우리는 정확하게 파악하는 데 집중하고 있습니다 어떤 깊은 학습 프레임 워크의 특정 구성 하드웨어에서 최대한의 성능을 끌어낼 것입니다 Google Compute Engine에 있습니다 그래서 우리는 각각의 새로운 그것을 컴파일하는 방법을 공개하십시오 당신 돈의 Google Compute에서 보유하고있는 내용과 TensorFlow의 공식 이미지에 포함 된 엔진 방금 다운로드 할 수있는 차이점이 표시됩니다

CUDA와 함께 우리는 92를 사용하고 TensorFlow는 90을 사용합니다 우리는 같은 CuDNN 있습니다

우리는 NCCL을 사용하고 있습니다 사실 110 [INAUDIBLE]도 NCCL 사용을 시작합니다 우리는 MKL을 사용하고 있습니다 CPU 인스턴스 만위한 MKL

그리고 MKL이 무엇인지 모를지라도, 비 GPU 인스턴스의 MKL이 당신을 포기할 수 있습니다 5 배의 성능 향상 5 번과 마찬가지로 빨리 비교할 수있는 무언가가 있습니다 공식 빌드 승인

그래서 이것은 당신이 이미지의 내부에 들어가는 것입니다, 이미 사전 구축, 구성 및 작동 준비가 완료되었습니다 이제,이 깊은 학습 이미지가 어디에 적합한 지 물어볼 수 있습니다 우리의 모든 다른 제품 중에서 Kubeflow가 있습니다 우리는 기계 학습 엔진을 가지고 있습니다

우리에게는 Colab과 다른 모든 것들이 있습니다 우리가 시장에서 제공하는 것 그래서 당신이 다른 제품의이 마술적인 줄을 본다면, 가장 왼쪽면이 완전히 관리되는 솔루션이라고 가정 해 보겠습니다 Machine Learning Engine 또는 Colab과 같은 것입니다 그리고 오른쪽이 솔루션입니다

데이터 센터와 컴퓨터에있는 것입니다 그리고 기본적으로 오른쪽 저쪽에있는 어딘가에, Google Compute Engine이 있습니다 당신은 당신이 원하는 것을 무엇이든 할 수 있습니다 아마 어딘가에 Kubernetes와 Kubeflow가 있습니다 아직 완전히 관리되지 않았습니다

GCE에서 기계에 접근 할 수있다 비록 당신이 Kubernetes를 달리고 있다고하더라도 이 멋진 남자의 인용문을 보여 드리죠 또한이 인용문이 무엇인지 기억하는 사람은 누구입니까? 이 견적을 누가 기억합니까? 그것은 오래된 인용문입니다 괜찮아

승인 승인 나는 한 손을 본다 관객 : Google 검색 사람들이 Google 검색을 잘못 입력 한 경우 VIACHESLAV KOVALEVSKYI : 닫기

하지만 실제로 그는 아마도 두 번 말했을 것입니다 누가 알아 그러나 그가 언급했을 때 한 가지는 Google Cloud가 처음 출시되었을 때 단 하나의 헌금이있었습니다 우리는 App Engine을 가지고있었습니다 App Engine은 정말 좋은 기술이었습니다

시장에 출시 된 최초의 서버리스 기술이었습니다 저 밖에 그러나 문제는 고객이 완전히 준비 됐어 그들은 투자 할 자원이 없었고, 그 당시에 모든 것을 브랜드로 옮기기 이전에는 볼 수 없었던 새롭고 새로운 접근 방식 그래서 에릭 슈미트 (Eric Schmidt) 우리는이 밝은 미래를 가지고 있습니다

그러나 우리는 고객이 현재있는 곳에서 고객을 만나야합니다 그리고 Google Cloud는 실제로 Google Compute를 도입했습니다 엔진 이제 우리의 깊은 학습 이미지가 바로 여기에 있습니다 그들은 자신의 솔루션을 가지고있는 곳입니다

당신은 당신 자신의 연구 파일, 논리를 가지고 있습니다 자신 만의 스핀 업 클러스터 솔루션이 있습니다 지금 원하지 않거나 어디로 든 이동할 수 없습니다 지금은 투자 할 수 없습니다 그러나 당신에게는 많은 유산이 있습니다

어딘가에 그것을 실행해야합니다 따라서 TensorFlow 또는 GPU로 실행해야하는 경우 GPU, 당신은 우리의 고객입니다 그것을 다룰 수있는 최상의 이미지를 만들어 낼 것입니다 승인 사용 방법? 이미지를 사용하는 몇 가지 방법이 있습니다

실제로 두 가지 가능한 주요 용도 우리는 UI 또는 CLI입니다 UI는 매우 단순하고 자기 탐색 적입니다 나는 그 부분을 실제로 만질 것입니다 나는 CLI, Common Line Interface 및 그 것들에 중점을 둘 것이다

너 알아야 해 그래서 당신이해야 할 첫 번째 일은 깊은 학습을 통해 인스턴스를 만들고 싶다면 이미지는 어느 특정 풍미를 알아 낸다 당신은 사용하고 싶습니다 이것은 현재의 맛의 그래프입니다 우리가 지금 제공하고있는 것 보시다시피, 우리는 두 가지 주요 프레임 워크, TensorFlow 및 PyTorch

그리고 만약 당신이 뭔가 다른 것을 필요로한다면, 말 그대로 CUDA가 필요합니다 CUDA의 다른 버전과 공통점이 있습니다 그래서 우선, 우리는 알아낼 필요가 있습니다 어떤 특정한 향기를 사용하고 싶습니다 이것은 이미지 패밀리라고도합니다

이 특정 예에서는 우리가 가족을 사용하고 있습니다 TensorFlow는 CUDA 92에서 최신 버전입니다 이것은 가족이 지정된 곳입니다 그리고 얼마나 많은 사람들이 만들고 있습니다

Google Compute에서 인스턴스를 생성하고 재생했습니다 엔진 또는 과거의 다른 클라우드 공급자? 꽤 많은 수 좋은 따라서 Google Compute Engine에서 인스턴스를 만드는 경우, 이미지의 패밀리를 지정할 수있는 기능이 있습니다 Docker 태그를 사용했다면 가족에 관해 생각할 수 있습니다

항상 최신 Docker Container를 가리 킵니다 그리고 내가 여기에서 멈춘 이유는, 문제에 대해 이야기하고 싶습니다 이미지 패밀리 또는 Docker Containers의 태그를 사용합니다 문제는, 만약 당신이 항상 최신의 것을 지적한다면, 이런 기회가있을거야 결국 나타납니다

이것은 NumPy 커뮤니티입니다 기본적으로 그들이 새로운 NumPy를 발표 할 것이라고 전 세계에 알리고 있습니다 그리고이 새로운 NumPy는 많은 것을 소개했습니다 많은 청소 그리고 이것은 많은 고객들에게 영향을 줄 수 있습니다

실제로 고객을 알고 있습니다 이 업데이트 된 NumPy로 인해 영향을 받았습니다 정확하게 이것 가족을 이용하고 있거나, Docker Container 최신 버전 사용, 아마도 최신 업데이트 보안 수정 때문에이 NumPy가 이미 포함되어 있습니다 이 NumPy가 가지고있는 것

그리고 아마도 당신을 망칠 것입니다 따라서 Docker 또는 이미지를 사용하는 경우, 직접 가족을 사용하는 것으로 전환해야합니다 다음 파이프 라인을 사용하여 제작합니다 3 단계입니다 가족으로부터 최신 이미지를 얻고 있습니다

솔루션으로 테스트하고 있습니다 그리고 당신은 자극적으로 그것을 사용하고 있습니다 언제나 이걸 좋아하세요 제발, 가족을 직접 사용하지 마세요 프로덕션에서 사용하는 경우 생산이란 교통을 제공하는 것이 아닙니다

나에게 오늘의 프로덕션은 내가 보여줄 나의 데모이다 그리고 내 데모에서는 정확한 이미지를 사용하려고합니다 당신이 추출 할 수있는 명령이 있습니다 정확하게 이미지 이름 그리고 오늘 저는 TensorFlow 최신 CPU를 사용할 것입니다

정확한 해쉬 이것은 기본적으로 사용할 이미지입니다 그리고 이제 나는 가족으로부터 나의 명령을 바꾸고있다 실제 이름으로 두 번째 – 이미지 프로젝트

우리는 실제로 일부 고객을 보유하고 있습니다 인스턴스를 만들 때, 프로젝트에 프로젝트를 설정하고 있습니다 그러나 이것은 우리의 이미지 인 이미지를 호스팅하는 프로젝트입니다 정책을 유지하십시오 문제는 GPU를 사용하는 경우, 인스턴스를 다른 하드웨어로 실시간 마이그레이션 할 수 없음 기계

이건 매우 중요합니다 그리고 이것을 고려할 때 이것을 알아야합니다 유지 관리를 위해 GPU를 사용하는 경우, 유일한 방법은 인스턴스를 실제로 종료하는 것입니다 다음 부분은 인스턴스를 만들고 싶다면, 당신은 그 가속기가 어떻게 또는 무엇인지를 설정하고 있습니다 당신이 사용하기를 원합니다

이것은 중요한 부분입니다 특정 가속기를 선택할 필요가 없다 우리가 가지고있는 넷에서 지역에 대해 스스로를 교육해야합니다 거기에 존재한다

잘못된 지역을 지정하는 경우 가속기가 존재하지 않으면 작동하지 않습니다 그리고 올바른 영역을 설정 한 후에, 정확한 액셀러레이터 올바른 액셀러레이터를 설정하는 방법 인스턴스에 연결할 것입니다 금액이 존재하지 않으면, 다시, 인스턴스를 생성 할 수 없습니다 예를 들어, 테슬라 v100 및 네 개의 테슬라 v100이 있습니다 우리는 아직이 구성을 지원하지 않습니다

그리고 마지막 하나 – 이 부분은 기본적으로 Google에 허가권을 부여합니다 Nvidia 드라이버를 설치해야합니다 문제는 이미지가 미리 설치된 CUDA 인 CuDNN과 함께 제공된다는 것입니다 모든 것은 사전 설정되고 테스트되었습니다 Nvidia 드라이버는 예외입니다

이런 식으로 된 이유는 몇 가지 있습니다 나는 그 특별한 이유에 관해 잠수하지 않을 것이다 하지만이 깃발이 없으면 엔비디아 드라이버가 없습니다 설치된 인스턴스에서 자, 다른 무엇을 조정할 수 있습니까? 필요한 경우 미리 사용할 수있는 플래그를 설정할 수 있습니다

선매는 기본적으로 – 선매품의 개념을 누가 압니까? 승인 그래서 Google Compute Engine에는 이러한 개념이 있습니다 선취 형 인스턴스의 경우 실제로 구매하는 경우 같은 경우지만, 더 싼 가격 때문에, 단 한 가지 단점이 있습니다 이 인스턴스는 언제든지 해제 할 수 있습니다 그래

나는 개인적으로, 내가 선매 사례를 쓰고있을 때마다, 그곳에서 많은 모델을 훈련 시키면, 그러나 때때로, 그것은 아무 것도없이 꺼져 있을지도 모른다 너 어떻게 말하는거야? 어쨌든 이제는 다음과 같은 경우 할당량을 확보해야합니다 당신은 GPU를 만들고 있습니다 따라서 할당량을 요청해야합니다

선점 가능한 인스턴스에 대한 할당량이 할당량과 동일하지 않습니다 정상 인스턴스로 Nvidia P100에 대한 할당량이있는 경우, 선점 형 Nvidia P100에 대한 할당량이 필요합니다 선점 가능한 인스턴스를 시작하려면 다음으로, 이와 같은 명령을 실행하려고한다면, 가능한 가장 작은 인스턴스를 가져옵니다 나는이 사람이 하나의 코어와 1GB 미만의 메모리를 가지고 있다고 생각한다

원하는 경우 지원되는 모든 컴퓨터 유형을 연결할 수 있습니다 다음으로 디스크 유형을 설정할 수 있습니다 이것은 실제로 SSD입니다 우리는 로컬 SSD 디스크를 지원합니다 SCSI 디스크

이것은 기본적으로 측정 및 속도 중 일부입니다 우리는 로컬 SSD 디스크로 당신을 보증 할 수 있습니다 그리고 가장 중요한 것은 새로운 유형을 도입했습니다 실제로 NVMI를 사용하는 로컬 SSD 디스크 인스턴스에 대한 연결 그리고 그것은 당신에게 – 그래서 오래된 것을 가진 상단에 하나, 하단에 하나 새로운 하나 – 나는 두 번 빨리 말하지는 않겠지 만, 훈련을받는 것이 중요합니다

디스크에서 데이터를 읽는 것이 필요합니다 그리고 마지막 하나 범위 이러한 범위는 실제로 필요합니다 TPUs를 사용하고 싶다면

그리고 저는 여기에서 실제로 전환 할 것입니다 콘솔에 두 번째 TPU 노드를 만들려고합니다 우리는 TPU 노드를 만들려고합니다 몇 분 안에 그것을 사용하십시오

그리고 TPU 노드를 몇 분 만에 생성하기 때문에, 지금 TPU 노드를 시작하겠습니다 그리고 네트워크 설정을 누르고 Create를 누릅니다 자, 내가 지금 막 메타 데이터를 지정할 때 Nvidia 드라이버 설치, Google에 허가를 당신을 위해 드라이버를 설치하십시오 실제로 클러스터가있는 많은 고객 클러스터에있는 많은 기계들과 함께, 그들은 부팅 할 때 매우 중요합니다 네 대의 기계가 있다면 네 대의 기계는 각각 8 개가 있습니다

가치가있는 V100을 사용하면 부팅 시간이 3 분, 이미 12 분 동안 돈을 내고있어 그래 네 대의 기계 – 12 분 동안 만 부팅 할 수 있습니다 일반적인 질문 중 하나는 OK입니다 내 컴퓨터 부팅 시간을 줄이려면 어떻게해야합니까? 대답은 간단합니다

인스턴스를 만들려는 이미지를 얻고 있습니다 Google 클라우드에서 가져 왔습니다 우리는 깊은 학습 사례를 만들 수 있습니다 운전수가 설치 될 때까지 기다리고 있습니다 3 ~ 5 분

그것은 끔찍한 일입니다 우리가이 일을하고 있습니다 그리고 이것은 개선 될 것입니다 – 인스턴스 중단 및 자체 학습 작성 그 인스턴스의 이미지 그 간단한, 5 단계와 당신은 자신의 이미지가 있습니다 그리고 그 이미지는이 유명한 15 초 시작 시간을 갖습니다

그 GCE는 다른 이미지를 제공합니다 승인 자, 주요 부분 실제로 우리가 어떻게 사용할 수 있는지 보도록하겠습니다 먼저 주피터 랩을 보여 드리겠습니다

Jupyter Notebooks 또는 Jupyter Lab을 누가 사용 했습니까? 좋은 그래서 가장 중요한 부분은 Jupyter Lab입니다 실제로 인스턴스를 만들어 사용하십시오 그래서 복사하고 하나의 명령을 붙여 넣습니다 방금 방금 슬라이드에서 본 명령입니다

더 크게, 더 크게, 더 크게, 더 크게, 더 크게 만들자 그래서 나는 내 이미지를 가지고있다 인스턴스 이름이 있습니다 나는 구역이있다 가자

기다리 자 아마 20 초 또는 반 분이 걸릴 것입니다 이것이 CPU 인스턴스이기 때문입니다 그것은 Nvidia 드라이버를 설치하지 않을 것입니다 이것은 내가 원래 당신에게 보여준 명령입니다

이 부분은 GPU를 사용하지 않는 경우에는 필요하지 않습니다 그래서 기본적으로 이것은 끝 명령입니다 승인 인스턴스가 나타나는지 봅시다 아니

대개 30 ~ 40 초 빨라집니다 승인 우리가 기다리는 동안, 이것은 작은 개선입니다, 내가 GitHub에서 언급 한 명령 중 하나 인스턴스에 SSH 할 수있게 해주는 명령 예를 들어, gcloud 대신 gssh를 사용하여 ssh를 계산하십시오

인스턴스의 이름을 입력하십시오 작은 개선만으로도 GitHub 페이지에서 찾을 수 있습니다 인스턴스에 연결하려면, 이 gssh INSTANCE_NAME을 실행하고 zone을 지정해야합니다 및 포트 매핑 이게 너 밖에없는 유일한거야

인스턴스가 정상적으로 작동 한 후에해야합니다 Jupyter Lab을 사용하기 시작합니다 인스턴스가 작동 중입니다 그럼 실제로 해보 죠 내 명령을 복사 해 붙여 보자

이미지를 실시간으로 연결하고 있습니다 브라우저로 가자 로컬 호스트 8080을 열자 여기 Jupyter가 있습니다 GPU로 인스턴스를 만들려면 Jupyter가 있어야합니다

V100과 함께 GPU를 갖게됩니다 문자 그대로 다른 것을 할 필요가 없습니다 인스턴스 시작을 제외하고 우리는 이미 Jupyter를 돌고 있습니다 백그라운드에서 포트 8080에서 수신 대기 중입니다 너를 위해 남겨둔 유일한 것 실제로 브라우저를 여는 것입니다

그것은 문자 그대로입니다 이제, 다음 유스 케이스 다음 유스 케이스는 Colab입니다 누가 콜랩을 사용 했습니까? 승인 그래서하지 않은 당신들을 위해 콜랩이 무엇인지 보여 주도록하십시오

Colab은 기본적으로 Google 서비스입니다 클라우드의 노트북입니다 그것은 노트북과 매우 유사합니다 실제로 유사한 유스 케이스를 제공하지만, 하지만 완전히 호스팅되었습니다 그래서 당신은 뒤에 기계가 없습니다

그러나 이것은 몇 가지 함축을 만듭니다 내가 그 의미를 정확하게 보여 주도록하겠습니다 따라서 Google Cloud 프로젝트가있는 경우, 그리고 당신은 당신의 기계를 가지고 있습니다, 당신은 TPU를 안으로 가지고 있습니다, 당신이 Colab과 함께 사용하고 싶다면, 당신은 할 수 없습니다 Colab에는 Google Cloud에 대한 개념이 없기 때문에 계획 Google 클라우드 프로젝트가 있다는 것을 이해하지 못합니다

거기에있는 어떤 리소스에도 연결할 수 없습니다 그러나 랩톱 컴퓨터가 있습니다 그리고 당신의 노트북에는 연결이 있습니다 포트 매핑 8080으로 인스턴스에 연결 우리가 방금 본 이유는 정확하게 Jupyter Lab을 여는 중입니다 그리고 당신의 인스턴스는 TPU에 연결되어 있습니다

이제 마지막 부분이 누락되었습니다 포트 8080에서 Colab을 노트북에 연결하는 것입니다 그리고 이것은 정확하게 기능입니다 우리가 몇 주 전에 발표 한 이제 우리는 깊은 학습 이미지를 사용할 수있게되었습니다 Colab의 백엔드로

그리고 그것은 매우 간단하게 작동합니다 콜랩으로 돌아가겠습니다 그래서 이것은 공식 Colab입니다 폰트를 늘려 보자 이것이 공식 Colab임을 다시 한 번 확인하겠습니다

TensorFlow의 버전을 봅시다 실제로 여기에 설치되어 있습니다 그것은 뭔가를하고 있습니다 그리고 그것이 결국 효과가 있기를 바랍니다 1

9이어야합니다 예, 19입니다 클라우드의 공식 버전이기 때문입니다 이제 로컬 런타임에 연결을 눌러 보겠습니다

기본적으로이 작업은 Colab 내 로컬 런타임에 그리고 항구는 8080입니다 그리고 지금 내 컴퓨터는 포트 8080에 있습니다 깊은 학습 VM의 포트 8080의 거울을가집니다 우리가 가진 사례

연결을 눌러 보겠습니다 그게 전부 야 이제 Colab은 원격 컴퓨터를 사용하고 있습니다 따라서 TensorFlow 19를 사용하면 어제 VM 이미지를 발표했습니다

TensorFlow 110과 함께 그래, 그래, 110, 그런데, 풀려났다, 네가 소식을 듣지 않았다면 이것은 기본적으로 의미하므로 이제 Colab을 사용할 수 있습니다 원하는 것을 포함하여 PyTorch, 가능한 모든 GPU, 심지어 TPUs

제가 말했듯이, 이제 우리는 깊은 학습을 사용하고 있습니다 백 엔드 이미지, 새로운 노트북을 만들어 보겠습니다 콜랩에서 그리고 우리가 TPU를 가지고 있다는 것을 보여주기 위해서, TPU에 접근하고, 나는 하나의 세포를 운영 할 것이다 그리고 우리는 여기서 그것을 실행할 수 있습니다

하나의 셀만 TPU에 연결됩니다 먼저 내 IP 주소를 알려주십시오 오, 동일, 100101

예 그것은 동일합니다 예 실제로 연결되어 있습니다 그래서 작동합니다

이제 TPU에 Colab을 사용할 수 있습니다 내가 말했듯이, 당신은 무엇이든 할 수 있습니다 깊은 학습 이미지를 갖춘 Colab, PyTorch, 가능한 모든 GPU 이제 우리가 일반적으로하는 또 다른 질문입니다 고객이 VM 이미지를 가지고있다

아나콘다를 어떻게하면됩니까? 나는 아나콘다를 사용하고 싶다 그리고 이것은 좋은 일입니다 아나콘다 시나리오에는 몇 가지 문제가 있습니다 그리고이 문제의 원인은 아나콘다를 설치 한 경우, Anaconda 내부에 새로운 가상 환경을 만드는 경우, 해당 환경 내에 TensorFlow를 설치해야합니다 어떻게 할 수 있니? 공식 TensorFlow를 설치하려는 경우, 공식 TensorFlow에 필요하기 때문에 작동하지 않습니다

CUDA 90, 우리는 92입니다 이를 지원하기 위해 우리는 실제로 바이너리 제공, Google Compute Engine 최적화 바이너리 이미지의 내부에서 미리 구워집니다 따라서 설치가 가능합니다

이것은 작은 스크립트입니다 공식 문서에 기본적으로 경로를 인용하고 있습니다 바이너리를 미리 굽고 있습니다 그런 다음 아나콘다 내부 깊숙히 설치하면됩니다 환경

승인 다음으로, 붙어 있다면 도움을 얻을 수있는 방법 우리는 당신을 지원하기 위해 다양한 채널을 보유하고 있습니다 물론 우리에게는 공식적인 문서가 있습니다 하지만 다른 것을 원한다면 다른 블로그를 적극적으로 사용하고 있습니다

우리의 이미지에 대한 사례 전용 StackOverflow 태그가 있습니다 우리는 적극적으로 모니터링하고 있습니다 거기에 질문을 제출하십시오 우리는 상당히 적극적인 Google 그룹을 운영하고 있습니다

당신을 도울 다른 사용자와, 나 또는 내 동료가 질문을하기 전에 언제든지 개인용 트위터에서 나를 핑 (ping) 할 수 있습니다 나는 정말로 어떤 질문을해도 감사 할 것이다 너는 나에게 메일을 보낼 수 있고 나는 대답 할 것이다 너희들을위한 가능한 모든 방법

승인 간략하게 요약하면, 심층 학습 이미지 모든 것을 가지고있는 미리 굽은 이미지입니다 다른 아이디어, Jupyter Lab, Jupyter로 시작할 준비가되었습니다 노트북, Colab 백엔드 및 거의 모든 프레임 워크 당신이 상상할 수있는 자, 이것은 정말로 중요한 조사입니다

할 수 있으면, 우리가 이해하도록 도와주세요 VM의 차기 버전에서보고 싶은 것 이미지, 단위 테스트로 추가 할 항목, 우리가 지원하기를 원하는 시나리오 이 설문 조사에 참여하십시오 고맙습니다 그럼이게 내 편이야 와줘서 고마워

더 많은 피자가 아직도 남아 있기를 바랍니다 다음에 너를보고 싶어 [박수 갈채] [음악 재생]

AI Adventures: art, science, and tools of machine learning (Google I/O ’18)

[음악 재생] YUFENG GUO : 아침 내 이름은 Yufeng Guo이고 YouTube에서 비디오 시리즈를 진행합니다

인공 지능 어드벤처 (AI Adventures)라는 곳에서는 예술, 과학, 기계 학습 도구 저는 오늘 그곳에있는 작은 조각을 직접 가져오고 싶었습니다 그럼 함께 인공 지능 모험을 떠나 봅시다 이 세션의 목적을 위해, 먼저 기계 학습에 대한 짧은 정의부터 시작해 보겠습니다 그것을 사용하여 워크 플로우를 구축하십시오

도구에 들어가십시오 우리는 오늘 그것을 사용하여 도움을 줄 것입니다 우리는 기계 학습 문제를 어떻게 해결할 수 있는지보고 있으며, 문제를 해결하는 데 어떻게 활용할 수 있는지 알아보십시오 I / O 외부 그래서 우리는 기계 학습을 말할 것입니다 데이터로 프로그래밍하고 있습니다

그리고이 데이터를 사용하여 시스템 또는 모델을 생성합니다 어떤 일을하도록 훈련 받았다 그리고 우리는 데이터를 사용하여 매우 중요한이 모델을 교육합니다 그리고 모든 것이 다시 데이터로 돌아옵니다 이것이 실제로 기계의 첫 번째 단계입니다

학습 – 데이터 수집 그것은 모두 중심에 있고 거기에서 시작됩니다 다음으로, 일반적으로 일종의 준비가 있습니다 해당 데이터가 필요합니다 원시 데이터는 종종 사용하기에 적합하지 않습니다

그래서 우리는 조금 준비해야합니다 귀하의 기계 학습 준비가되기 전에 셋째, 모델을 선택해야합니다 우리는 그것을 사용하고, 훈련시키고, 평가하기를 원합니다 그 성능, 미세 조정, 마지막으로 그러한 예측을하십시오

그래서 우리는이 7 가지 단계를 각각 거치게됩니다 이 세션의 과정에서 먼저 질문을 봅시다 우리는 우리 모델을 사용하여 첫 번째 문제를 해결하려고 노력하고 있습니다 간단한 예제 데이터 세트를 살펴 보겠습니다 이 7 단계를 통해 분류 작업을 수행하십시오

동물에 관한 데이터 우리는 어떤 종류의 동물이냐고 말할 것입니다 일부 입력 데이터를 기반으로합니다 이것이 새입니까? 그것은 포유 동물인가? 그것은 파충류 물고기, 또는 양서류, 버그, 또는 무척추 동물? 이 7 가지 유형 중 하나 그리고 그것은 다양한 통계에 기초 할 것입니다

주어진 동물에 대해서 따라서 우리 모델은이 데이터,이 구조화 된 데이터, 그것을 사용하여 예측을 시도하십시오 -이 7 가지 중 하나 동물의 종류 이제 우리는 어떤 상황이 우리는 모델링을하고 있습니다 이 단계들을 더 자세히 설명합니다 우선, 데이터 수집 중입니다

우리는 어떤 문제인지 알고 있기 때문에 우리는 해결하려고 노력하고 있습니다 항상 그렇지는 않습니다 이를 해결하기 위해 필요한 데이터가 있음을 의미합니다 데이터가 없으면 모델이 아무 곳에도 없습니다 그래서 내 데이터가 어디에서 어떤 형식으로 살고 있는지 스스로에게 물어보십시오

어떻게해야합니까? 이들은 종종 초기 걸림돌이다 우리는 문제를 해결하고 해결하기 위해 데이터를 사용하려고 노력합니다 그리고 아마도 당신은 실제로 상황에 처해 있습니다 필요한 모든 데이터가없는 곳입니다 자신의 데이터를 수집해야합니다

이것은 또한 일반적인 사용 사례입니다 그리고 당신은이 문제를 푸는데 독창적이 될 수 있습니다 데이터 수집을위한 시스템을 구축함으로써, 아마도 당신은 그것을 게임으로 만들 것입니다 정말 재미있는 예가 Quickdraw입니다 Quickdraw는 온라인 게임으로 당신은 특정 그림을 그려서 시도합니다

네가 그리는 것을 예측하는거야 그래서 그것은 당신에게 농구를 그리거나 배를 그립니다 그리고 당신도 알다시피, 그것은 재미 있습니다 사람들은 그것을 좋아합니다 결과적으로 게임이 생성되었습니다

십억 개 이상의 손으로 그린 ​​이미지의 기념일 로고 전 세계에서 그리고이 데이터 세트는 GitHub에서 오픈 소스입니다 실제로 AI 모험 에피소드가 있습니다 이 데이터 세트를 사용하는 방법에 대해 자세히 알고 싶으면 놓으십시오 그걸 가지고 놀아 라

하지만 우리의 계단으로 돌아가 우리는 데이터를 수집했습니다 무엇 향후 계획? 우리는 그 데이터를 준비해야합니다 데이터 준비는 완전히 별도의 대화가 될 수 있습니다 여기서는 몇 가지 측면 만 다루겠습니다

어떤 종류의 기계 학습을하기 전에 데이터를 탐색하십시오 실제로 데이터를 더 잘 이해하는 데 도움이 될 수 있습니다 이것이 당신에게주는 것이기 때문에 이것은 근본입니다 데이터 세트에 대한이 직관, 당신에게 많은 시간과 두통을 줄 수 있습니다 나중에 그 과정에서

그래서 저는 사람들이 그들의 데이터를 청소하도록 권장합니다 데이터를보고 그것에 대해 어떤 종류의 직감을 얻으 려합니다 간격을 확인하는 데 도움이됩니다 그 길을 따라 일하는 것에 대해 많은 것을 배웁니다 그리고 실제로 더 많은 데이터가 필요하다는 것을 알게 될 것입니다

또는 수집 한 특정 데이터 결국 실제로 그렇게 유용하지는 않았습니다 이 작업을 수행하기 위해 내가 좋아하는 도구 중 하나는 Facets입니다 우리는 잠시 우회하여 그것에 대해 이야기 할 것입니다 패싯은 오픈 소스 데이터 시각화입니다 Google Research의 도구입니다

데이터 배포에 대한 더 나은 이해를 얻을 수 있습니다 그리고 네, 가능한 많은 도구가 있습니다 당신은 아주 비슷한 일을합니다 명령 및 호출 함수를 작성할 수 있으며, 하지만이 모든 것이 한 곳에서 이루어집니다 UI이기 때문에 잊지 않을 것입니다

특정 통계를 계산하는 것 또는 데이터의 일부를 살펴보십시오 그것은 모두 당신을 위해 계산 되었기 때문입니다 그냥 나타납니다 그래서, 당신은 그냥 찾아 볼 수 있습니다 여기에서 우리의 데이터 세트에 적용된 패싯을 볼 수 있습니다

동물원에서 나온이 동물들 중 대부분은 일종의 것들이며 제로 데이터 세트는 호흡합니까? 꼬리가 있습니까? 깃털이 있니? 그런 것들 그래서 우리는 이런 종류의 재미있는 분포를 0으로 보았습니다 ~ 1 그러나 숫자 배포판을 사용하는 많은 경우, 훨씬 더 흥미로운 것을 보게 될 것입니다 자, 기계의 세 번째 단계로 넘어 갑시다

학습 – 모델 선택 그리고 우리는 모델 선택에 대해 조금 논의 할 것이고, 우리가 이것을 사용하는 방법에 대해 가능한 최소한의 노력 그리고 먼저, 주위에 직감을 구축합시다 기계 학습 모델이 잘 작동합니다 그래서 여기에서 우리는 모델이 어떻게 시도 하는지를 봅니다

우리가 말하려고하는 지역을 나누기 위해, 어느 쪽이 파란색이고, 어느 쪽이 주황인지, 점들인 데이터와 일치시킵니다 따라서 세계에서 가장 어려운 사례는 아닙니다 권리? 모든 것이 이미 영원히 분리되어 있습니다 분리했다 그러나 좀 더 재미있는 것을 보도록하겠습니다

여기, 우리는 약간의 모델 투쟁을 본다 그 동그라미를 그리는 방법을 찾으려고 시도 할 때 파란색 점 주위 그리고 이러한 도구가 오늘 당신에게 사용 가능하며, 충분히 정교합니다 당신을위한 모든 사소한 부분을 다룰 수 있습니다 그래서 당신은 어떻게에 대한 세부 사항을 걱정할 필요가 없습니다

그것에 대해지고있다 그것은 그 일을 성취하는 것의 문제 일뿐입니다 그러나 보는 재미입니다 또한 서로 다른 모델이 서로 다른 종류의 데이터를 모델링 할 수 있습니다 복잡한 정도가 다르다

그래서 이것이 모델 선택이 실제로 무엇인지에 대한 것입니다 그것은 어떤 모델이 딱 맞는지를 보는 것입니다 특정 데이터 세트 및 특정 문제 당신은 풀려고 노력하고 있습니다 이제 구체적으로, 우리가하려고하는 것 이것을 달성하기 위해 TensorFlow를 사용합니다 그래서 TensorFlow에 관해 많은 이야기가 있습니다

여기에 I / O에서 올해, 그래서 그 비트를 rehash하지 않습니다 그러나 우리는 예를 들어, 아마도, TensorFlow를 사용하여 모델을 수행하는 모습 선택, 실제로 그 코드를 쓰려면, 특히 경험치가 너무 많지 않은 경우 TensorFlow와 함께, 이것은 친절 할 수 있습니다 얼마나 쉽게 접근 할 수 있는지에 대한 유용한 정보를 제공합니다 이것은 선형 분류 자의 예입니다 우리가 본 첫 번째 애니메이션과 비슷합니다

드로잉은 두 공간 사이에 선형 선이 좋습니다 그리고 우리는 그것이 매우 간단하다는 것을 알 수 있습니다 그러나 더 복잡한 데이터가 있다면 어떨까요? 이 한 줄 전화는 음, 일종의 전화를 유지합니다 당신이 다른 모델에서 그것을 시도 할 때 그래서 우리는이 것을 깊은 신경 네트워크로 대체 할 것입니다

몇 가지 작은 수정이 필요합니다 이 경우에는 추가 인수 하나를 추가해야합니다 숨겨진 단위라고합니다 이것은 우리 네트워크의 구조를 정의합니다 이 경우, 우리는 30, 20, 10 개의 뉴런이 있습니다

그래서, 우리가해야 할 일은 말 그대로, 그냥 이름 바꾸기 – 그 텍스트를 대체하고 하나의 인수를 추가하십시오 전체 시스템을 다시 연결할 필요는 없습니다 모든 것을 삭제하고 시작할 필요가 없습니다 기스로부터 그래서 그것은 정말로 산뜻합니다

그리고 시도 할 수있는 다른 모델과 비슷합니다 많은 사람들이 모델을 뒤집습니다 메소드 호출의 이러한 다양한 선택 메뉴로 놀 수 있습니다 그리고 그 패러다임에서 미리 모델에 커밋하지 않아도됩니다 한 번 시도해보고 어떻게 작동하는지보고 다시 돌아올 수 있습니다

이 7 단계 때문에, 그리고 당신은 다시 반복 할 수 있습니다 언제든지 돌아가서 돌아볼 수 있습니다 그래서 우리를 다음 단계로 인도합니다 우리는 데이터를 수집했습니다 우리는 그것을 준비했습니다

우리는 최소한 모델을 선택했습니다 그리고 지금, 우리는 훈련을 할 수 있습니다 교육은 많은 관심을 얻습니다 왜냐하면 그것은 어떤면에서 마법이 일어나는 곳이기 때문입니다 그러나 실제로, 그것은 종종 매우 간단합니다

너는 그냥 뛰게하고 기다린다 그럼 훈련 도중 무슨 일이 일어나는지 살펴 보겠습니다 코드에서 볼 수 있습니다 개념적으로 모델을 훈련 할 때 우리는 데이터를 전달합니다 우리는 즉시 모델을 통해 예측을 시도합니다

그러나 예측은 꽤 나쁠 것입니다 왜냐하면 우리 모델은 무작위로 초기화되기 때문입니다 그러나 우리는이 예측을하고 그것을 취하여 비교합니다 진정한 대답, 우리가 알고있는 정답 그리고이 정보를 사용하여 모델을 업데이트합니다

따라서 모델을 검토하고 업데이트 할 때마다 작동하면서 새로운 데이터 조각으로 훈련 세트를 통과하는 길, 시간이 지남에 따라 모델이 더 좋아질 수 있습니다 각 교육 루프와 함께 따라서 교육 과정은 이와 같습니다 그러나 실제로, 코드를 실제로 작성해야 할 때, 우리는 모델을 만든 우리의 기능을 사용합니다 그리고 우리는 방금 그것에 도트 트레인을 불렀다

그것은 문자 적으로 한 줄입니다 당신은 그 기능을 제공 할 필요가 있습니다 교육 데이터 입력을 제공합니다 그것은 한 줄입니다 그리고 일단 훈련이 끝나면 – 이 기능을 실행하면 꺼져서 샌드위치를 ​​잡고, 그리고 당신은 돌아오고 평가를 할 시간입니다

우리는 우리 모델을 평가해야합니다 그것이 얼마나 정확한지 보는 것입니다 기본 작업을 잘 수행하는지 확인하십시오 그래서 우리는 사물의 몇 가지 예를 보여줄 수 있습니다 우리가 올바른 답을 알고 있다는 것, 모델은 훈련에서 이러한 질문을 보지 못했습니다

그것은 훈련에서 그 데이터를 보지 못했습니다 따라서 우리가 따로 설정 한이 평가 데이터를 사용합니다 우리 모델의 성능을 측정합니다 개념 상으로는 교육과 매우 유사합니다 여전히 같은 모양입니다

그러나 중요한 차이점은 상단에 화살표가 없습니다 그것은 폐쇄 루프가 아닙니다 예측을 확인하면 모델이 업데이트되지 않습니다 결과 그리고 모델을 업데이트 한 경우, 그러면 그것은 훈련과 다를 바 없으며, 우리는 본질적으로 속일거야

따라서 평가 데이터는 그런 식으로 소중합니다 모델을 업데이트하는 데 사용하지 않습니다 우리는 그것을 옆으로 잡고 그것을 예비 해 둔다 우리 모델의 성능을 평가할 수 있습니다 코드에서는, 우리가 본 모든 것만 큼 간단합니다

우리는 점 평가를 호출합니다 평가하고 싶다면 점 평가를 호출하십시오 그리고 우리가 평가 데이터를 전달하고 있음을 주목하십시오 그것은 eval 입력 함수입니다 따라서 교육 자료가 아닙니다

그리고 우리가 훈련 데이터를 사용한다면 – 우리는 그 줄을 복사했다고 가정 해 봅시다 우리는 방금 스왑 아웃, 평가를 위해 훈련, 데이터 소스를 변경하는 것을 잊었습니다 이제 우리는 우리 모델의 성능을 훈련 데이터, 그리고 그것은 큰 실수가 될 것입니다, 모델이 교육 데이터를 위해 최적화 되었기 때문입니다 따라서 동일한 데이터를 사용하여 평가할 경우 어떤 일이 발생합니까? 당신이 당신의 모델의 진정한 성과를 허위 진술하고, 실제 데이터에서 제대로 수행되지 않을 가능성이 있습니다 한 번 배포하면 결코 볼 수 없으므로 그리고 당신은 그것이 어떻게하는지 결코 측정하지 못했습니다 이전에 보이지 않는 데이터와 그래서 이것은 우리를 다음 단계로 안내합니다

그러면 우리는 실제로 모델을 어떻게 개선 할 수 있습니까? 우리는 훈련을 실시했다 우린이 짓을 했어 우리는 평가를 실행했습니다 이제 뭐? 우리는 더 많은 훈련을 받고 있습니까? 우리는 그것을 어떻게 더 조정할 수 있습니까? 우리는 언제나 새로운 모델로 교체 할 수 있습니다 그러나 우리가이 모델을 결정한다면, 그러나 우리는 그것을 향상시키고 자 하는가? 여기서 하이퍼 파라미터 튜닝이 이루어집니다

이 모델들은 그들 자신의 매개 변수를 가지고 있으며, 그러나 우리는 어떤 가치를 사용해야합니까? 그리고 우리는 그들을 어떻게 골라야합니까? 다른 모델을 시험해 볼 수있는 것처럼, 당신은 또한 다양한 모델 파라미터를 시험해 볼 수 있습니다 이 과정은 하이퍼 파라미터 튜닝이라고 불리며, 어떤면에서는 여전히 연구 활동의 영역으로 남아 있습니다 그러나 그것이 당신이 그것을 이용할 수 없다는 것을 의미하지는 않습니다 개념적으로, 우리는 우리의 훈련을받습니다, 한 모델 만 교육하는 대신, 그 모델을 조정할 것입니다 다양한 변형을 만들 수 있습니다

그래서 우리는 다양한 변형에 대한 교육을 실시 할 것입니다 같은 기본 모델이지만 다른 모델 매개 변수를 사용하여 정확도에 미치는 영향을 확인하십시오 그래서 우리는이 모든 변형들을 훈련하고 평가할 것입니다 동일하거나 유사한 모델을 선택하고 어느 것이 가장 잘하는 지보십시오 그것이 우리의 매개 변수 선택을 알리는 방법입니다

그러나 당신은 많은 것을 실험적으로 보았습니다 당신은 그 (것)들을 작동하기 위하여 보는 시도해야한다 따라서 네 루프를 벗어나야 할 수도 있습니다 그래서 좋은 하이퍼 매개 변수를 선택하는 작업입니다 아마도 당신이 이것을 직관했을 것입니다

당신은 아마 기계 학습 문제로 변할 수 있습니다 그 자체– 모델의 매개 변수 최적화 당신이 기계 학습을 위해 사용하고있는 그러나 우리는 다른 대화를 위해 그것을 구해야 할 것입니다 그래서 우리는 데이터를 수집했습니다 우리는 그것을 준비하고 모델을 선택하고 그것을 훈련 시켰습니다 데이터를 평가하고 하이퍼 매개 변수를 조정했습니다

마침내 우리는 마지막 단계에 도달했습니다 그 예측을합니다 이것은 훈련의 전체 요점이다 처음에는 모델이었습니다 정말 정확한 정확성을 얻는 것이 아니라, 또는 서버에 열을 가할 수 있습니다

실제로 그걸로 뭔가 유용한 일을하는 것이 었습니다 그래서 예측을하면 모델을 선택합니다 우리는 어딘가에 그것을 배치하거나 우리가 그것을 격리시켜, 우리는 모델에 그것이 가지고 있지 않은 일부 데이터를 보여줄 수있다 훈련을받은 후 어떤 결과물을 보는지 그것은 예측한다 그리고 그것은 우리의 7 단계입니다

기계 학습의 개념적 7 단계입니다 실제로 실제로 어떻게 보이는지 봅시다 우리는 사물의 툴링 측면으로 돌아갈 것입니다 TensorFlow 외에도 사용하는 것을 살펴보십시오 실제로이 7 가지 단계를 어떻게 달성 할 수 있는지에 대해 설명합니다

그래서 우리는 몇 가지 코드를 살펴볼 것입니다 특히 두 가지 도구가 제공됩니다 우리가 손을 잡을 테니 추가 리소스도 참조하십시오 먼저 Co Lab이라는 도구가 있습니다 어떤 종류의 노트북 환경에서도 작업 한 적이 있다면 또는 REPL을 웹에서 사용하기 전에 기본적으로 브라우저에서 Python을 실행하는 방법입니다

그러나 파이썬 만 실행하는 것이 아니라 전체적인 노트북 환경입니다 마크 다운, 코드 실행, 기본적으로 Google 드라이브에 호스팅되기 때문에 다른 사람들과 공유 할 수 있습니다 이제 데모로 전환 해 보겠습니다 CO Lab을 사용하는 모습을 보여줄 수 있습니다 그래서 우리는 여기 – 나는 Co Lab을로드하고 우리는 다양한 명령을 실행할 수 있습니다

모든 것 우리는 기대할 것입니다 이제 우리는 여전히 연결되어 있습니다 Co Lab에서는, 그것은 노트북 환경이기 때문에, 자신의 파일을 업로드해야합니다 인터넷에 연결되므로 인증 할 수도 있습니다 물건을 끌어 내려요

필자의 경우에는 데이터 세트가 머신에로드되었습니다 그리고 우리는 그것을 다운로드 할 수 있습니다 그리고 판다가 여기에 실려 있습니다 따라서 우리는 데이터 세트를 살펴볼 수 있습니다 약속대로, 그것은 동물의 무리 다

그리고 많은 통계 자료들, 그리고 결국, 클래스 유형이 있습니다 그래서 Co Lab에서는 실제로 코드를 실행할 수 있습니다 화면에 – 음, 실시간으로 또한 Google 드라이브에서 모두 호스팅되기 때문에, 백그라운드에서 어떤 기계를 돌려야 할 필요는 없습니다 그냥 원활하게 작동합니다

그리고 다른 사람들과 의견을주고 다른 사람들과 의견을 나눌 수 있습니다 과– 거기에 우리가 간다 일반적으로 공동 연구를하거나 일을해야합니다 그래서 그것은 정말로 산뜻합니다 그래서

보자 내 생각 엔 시간이 좀있어 그러니 실제로 내가 여기서 뭘했는지 조금 지나쳐

우리는 데이터를 가져 왔고, 내가하고있는 일은 그것을 섞은 다음 데이터를 분할합니다 그래서 우리는 전체 데이터 세트를 가지고있었습니다 이 전체 데이터 세트는 101 개의 다른 동물로 구성됩니다 아마도 가장 작은 데이터 세트 일 것입니다 아마 내가 만났을거야

하지만 여전히 동일한 유형의 모범 사례를 수행해야합니다 이 경우, 나는 그것을 가져 와서 나누었습니다 교육 및 평가 데이터로 변환합니다 왜냐하면 내가 훈련을하기 위해 모두 101을 사용한다면, 내 모델을 평가하기 위해 무엇을 할 것입니까? 그래서 우리는 그것을 나눌 것입니다 이 경우 나는 60 %와 40 %의 비율을 선택했다

그 비율은 조정될 수 있습니다 그리고 우리는 우리가 볼 수 있습니다, 우리는 우리의 훈련 데이터 – 모든 60 값 그리고 우리는 아래의 평가 데이터를 가지고 있습니다 그리고 저는 약간의 전처리를합니다 이것은 귀하의 데이터 비트 처리입니다

특히 데이터 세트의 마지막 열은 레이블입니다 그것은 대답이다 올바른 유형의 동물의 1에서 7까지 그것은 파충류, 양서류, 포유류 등입니다 문제는 레이블이 1에서 7로 이동한다는 것입니다 그리고 나는 그들에게 6을 통해 0이 될 필요가있다 이 특별한 경우에 그래서 나는 그것을 하나씩 뺍니다

하나를 뺍니다 그리고 그게 전부입니다 아주 간단한 사전 처리 아마 더 큰 데이터가, 아마, 더 많은 일을 할 것입니다 그리고 우리는 우리의 데이터가 분명히, 나는이 일을하지 않았다

항상 코드를 실행하십시오 여기에 우리의 입력 함수는 매우 간단합니다 우리의 원시 데이터가 필요하며, 만약 우리가 그것을 원한다면, 데이터 세트에서 임의로 호출 할 수 있습니다 그리고 나는 필요에 따라 반복하고 배치를 청크로 만들었습니다 그래서 이것은 훈련에 바로 들어가게 될 것입니다

데이터 세트에 대한 이야기가 있었다고 생각합니다 구체적으로는 입출력이 빠릅니다 그래서 놓친다면 녹음을들을 수 있어요 또는 라이브 스트림을 롤백 할 수 있습니다 그래서 우리는 데이터 집합을 가지고 있습니다

또는 우리의 입력 기능 그리고 나는 세포를 다시 돌리는 것을 잊었다 고 생각합니다 그리고 이것은 제가 여기있는 작은 세포입니다 내 입력 기능을 시험해보기 위해, 작동하는지 확인하려면 – 항상 물건을 테스트하는 것이 좋다 그래서, 우리는 입력 기능이 실제로 있다는 것을 알 수 있습니다

깃털의 각 유형에 대한 모든 데이터를 반환합니다 알을 낳고, 공중에 무엇이 있고, 백본이 있는가? 그런 것들 따라서 각 배열은 일괄 처리 된 데이터를 나타냅니다 그리고 나는 또한 이것으로 놀고 있었다 각 열의 고유 한 값을 확인하는 것 대부분이 1과 0이라는 것을 확인하기 위해, 그러나 조금 이상한 몇 가지가 있습니다

예를 들어, 5 개의 다리가있는 동물이 있습니다 따라서 모든 데이터 세트가 완벽하지는 않습니다 TensorFlow는이 기능 항목 개념을 사용합니다 들어오는 데이터를 나타냅니다 모델은 매우 일반적이므로 기능 열을 사용하여, 특정 데이터 세트에 맞게 사용자 정의 할 수 있습니다

우리의 경우 모든 데이터 (모든 열, 그 중 숫자 17 인 17 개가 모두 그것을 숫자로 설정하십시오 그래서 그것은 단지 구성입니다 TensorFlow에 몇 개의 열과 어떤 유형이 있는지 알려주 들어오고있어 그래서 우리는 그것을 실행할 것입니다 그리고 일이 깨면 그것은 내가 셀을 실행하는 것을 잊어 버렸으므로, 그렇게되면 저에게 소리를 지르십시오

그리고 여기에 우리가 전에 본 선이 있습니다 모델 생성과 함께 여기서는 선형 분류자를 만들고, 해당 지형지 물을 가져오고, 7 개의 다른 클래스가 있다고 말하자 동물에 대해 가능한 다른 값 기차와 평가를 결합했습니다 기차를 타고 함수를 함수로 평가한다

편의를 위해, 그래서 그들은 둘 다 함께 달린다 나는 훈련 자료를 훈련시키고 싶다 평가 데이터에 대한 평가를 실행하고 싶습니다 이렇게 함께 배치하면 세포를 재실행 할 때 버그가 생기지 않도록하십시오 네가 따라갈 때

선형 모델을 실행한다고 가정 해 봅시다 우리는 그 방향을 돌립니다 따라서이 모든 것이 Google의 서버에 의해 뒷받침됩니다 그리고 명백하게, 그것은 그것의 달콤한 시간을 보내고 있습니다 그것이하는 동안 – 글쎄, 이건 끝났어

그래서 우리는 90 %를 얻었습니다 이것은 OK와 같습니다 맞습니까? 100 개의 행만있었습니다 우리는 훈련을 위해 60 명을 가져 갔고 평가를 위해 40 명을 사용했습니다 그래서 그것은 가장 신뢰할만한 척도가 아닙니다

여기에 도구가 있다는 아이디어가 있습니다 코드가 있습니다 이를 자신의 데이터로 바꾸어야합니다 이 데이터 세트보다 훨씬 좋을 것입니다 멋진 결과를 얻을 수 있습니다

따라서 약속대로, 심 신경 네트워크는 매우 유사합니다 그것은 문자 적으로 이전과 동일합니다 그러나 나는 그것을 숨겨진 단위로 바꿨다 나는 주목할만한 차이가 하나 있다고 생각한다 내가 이전 기능을 사용한다는 것입니다

우리가 전에 가지고 있었던 컬럼들 표시기 열에 그래서 이것은 선형 네트워크를 배치하기위한 공간 일뿐입니다 데이터를 심 신경 네트워크가 표현할 수있는 방식으로 변환합니다 그래서이 이야기의 범위를 벗어났습니다 하지만 그것은 단지 깊은 신경 네트워크를위한 조정입니다

선형 네트워크는 처리 할 필요가 없습니다 그래서 우리는 그것이 만들어 지도록 할 것입니다 죄송합니다 방금 새 셀을 만들었습니다 그래서, 그것은 또한 여기에서 과시하는 것이 좋습니다

따라서 우리는 매우 쉽게 코드 블록과 셀 블록을 생성 할 수 있습니다 그 사이에 모든 종류의 훌륭한 편집 작업을 할 수 있습니다 능력은 여기에 있습니다 그리고 당신은 그것을 markdown으로 바꿀 수 있습니다 셀을 실행합니다

그리고 거기에있을거야 그래서 깊은 네트워크 – 내가 이것을 도망 간다는 것을 잊어 버린다 어쩌면 우리는 그것을 다시 실행할 것입니다 모델을 더욱 밀어 넣을 수도 있습니다 여기 백분율은 때로는 불안정합니다

왜냐하면 그들은 – 평가 데이터에는 40 개의 값만 있기 때문에, 이것은 사실입니다 40 세가 넘는 사람들이 올바르게 받아들이고 있습니다 다른 것들은 틀린 것입니다 그래서이 경우 10 %, 아마도 약 4 % 잘못되었거나 3 ~ 4 개가 잘못되었습니다 그래서 몇 가지 예언을하고 놓친 것을 봅시다

TensorFlow에는 도트 예측 기능도 있습니다 마치 기차와 도트를 평가하는 것과 같습니다 그래서, 당신은 통과 할 수 있습니다 방금 평가 자료를 가져 와서 몇 장을 나눠 냈어 보십시오보기의보기

그래서 우리는 우리가 그렇게 할 때, 당신은 예측과 올바른 대답을 얻습니다 그래서이 경우, 내가 임의로 선택한 다섯 가지 일이 생겼어 그러나 우리가 잘못한 정확한 것을보고 싶다면 어떻게해야할까요? 그래서 이것은 내가 도망친 작은 실험이었다 단지 내가 궁금해서 – 어느 것이 선형 네트워크가 잘못되었는지 그리고 어떤 것들은 깊은 네트워크가 잘못 되었습니까? 이 경우에는 서로 다릅니다 그들은 같은 숫자의 잘못된 예측을 가지고 있습니다

그들은 모두 네 가지가 잘못되었지만 실제로는 다른 예 그리고 이것은 더 깊이 파고들 수있는 기회가 될 것입니다, 그걸 가지고 놀아 라 마지막으로 내가 추가 할 것은 Co Lab 또는 Co Laboratory입니다 GPU를 지원합니다 그래서 GPU를 토글 할 수 있습니다

큰 데이터 세트와 멋진 모델이 있다면, 그런 종류의 물건에 액세스하고 그 GPU를 얻고 싶습니다 슬라이드로 돌아가 봅시다 간단히 살펴보고 다른 도구를 살펴보십시오 CO 연구실 외에 다른 도구가 있습니다 우리는 매우 유사합니다

노트북 기반이기 때문에 들어 보셨을 것입니다 그것은 Kaggle이라고합니다 그리고 Kaggle이 대회로 가장 유명하지만 토론 포럼 및 데이터 세트, 또한 Kernels라는 기능이 있습니다 그리고 커널은 실제로 노트북의 멋진 이름입니다 그리고 커널은 이런 모습입니다

Co Lab에서 익숙해지기 시작할 수도 있습니다 파란색은 제외하고 그리고 커널은 몇 가지 미묘한 차이가 있습니다 첫째, 나는 ~하고 싶다 Kaggle Kernels의 데모로 전환 해 보겠습니다

우리는 그 모습을 볼 것입니다 어떻게한다는거야? 그래서 저는 이전에 Co Lab에서 가지고 있던 노트북을 가져갔습니다 나는 노트북 자체를 다운로드했다 IPython 노트북 파일로 Kaggle에는 데이터 세트가 있기 때문에 실제로 동물원 동물 분류 데이터 세트가 있습니다

정확한 데이터 세트를 얼마나 편리하게 선택했는지 그것은 이미 Kaggle에 존재합니다 그래서 새로운 커널을 클릭 할 수 있습니다 노트북을 고를거야 그리고 Kaggle Kernels는 파이썬에서 동작 할뿐만 아니라, R에서 실행하도록 선택할 수도 있습니다 R을 선호합니다

제가 할 수있는 일은 실제로 제가 할 수있는 일입니다 노트북 업로드 – 음, 먼저 그 노트를 다운로드해야합니다 그럼 그렇게 하죠 그래서 Co Lab에서 우리는 다운로드 할 것입니다 – 이것은 내가 크게 확대하는 것입니다 책을 다운로드하십시오

그런 다음 다운로드가 완료되면 그 노트를 다시 Kaggle Kernels에 업로드 할 수 있습니다 그래서 붐

커널과 동일한 노트가 있습니다 하나의 작은 비틀기가 있습니다 로컬 드라이브에서 파일을 업로드해야했기 때문에, Co Lab을 위해, 우리는 그것을 제거 할 것입니다 그리고 유일한 다른 조정은 Kaggle Kernels에서 데이터입니다 입력이라고하는 하나의 디렉토리에 있습니다

첫 번째 셀을 실행하면 우리는 아래로 나아갈 것입니다 우리는 데이터가 입력에서 살아 있음을 볼 것입니다 그리고 그것은 같은 종류의 것입니다 그리고 우리는 이미 노트북의 나머지 부분을 보았 기 때문에, 그것은 문자 적으로 같은 것입니다 재미있는 것은, 커널에서, 우리는 할 수 있습니다

어디 보자 이름을 지어 보자 그리고 우리는 그 노트를 저 지르 수 있습니다

그리고 Kaggle Kernels이하는 일은 그것입니다 새로운 신선한 환경에서 노트북을 운영 할 것이며, 당신이 속한 세션과는 별도로 그러면 모든 출력이있는 노트북이 생성됩니다 우리가 일종의 훌륭한보기 전용 형식으로보고있는 정말 공유에 유용합니다 왜냐하면 당신이 당신의 노트를 공유하고 싶다면, 그것이 실행 된 방법뿐만 아니라 다른 사람들에게도 마찬가지입니다 재현 가능한 노트북을 원한다면 우리가 여기에서 보는 것의 종류

그래서 우리는 수첩을 썼다 끝났다 그리고 그 스냅 샷을 볼 수 있습니다 그래서 GitHub 모델과 비슷합니다 당신의 노트를 버틸 수있는 것처럼 따라서 기본적으로 노트는 비공개입니다

그리고 우리는 여기서 일들이 도망가는 것을 볼 수 있습니다 나는이 모든 것들을 하나씩 수행 할 필요가 없었습니다 그리고이 세포들을 수동으로 작동시키지 않으면, 이전에, 내 결과를 얻기 위해 이처럼 위에서 아래로 그 종류의 버그를 잡는 데 도움이됩니다 도움이 될 것입니다 내가 내려올 때 길 아래로 내 공연 이번 주 또는 다음 달에

그리고 노트를 공유하면, 노트를 포크 할 수 있습니다 그들을 포크로 찍을 수 있습니다 당신은 또한 다른 사람들이 당신의 노트를 포크로 찍게 할 수 있습니다, 또한 노트북에 공동 작업자를 추가 할 수 있습니다 동일한 노트에 사용자를 추가 할 수 있습니다 그냥 그들을 포크보다

따라서 많은 훌륭한 공동 작업 모델이 있습니다 Co Lab 및 Kaggle 전체에서 특정 유스 케이스에 그리고 간단히 언급하면 ​​좋을 것 같습니다 Co Lab과 마찬가지로 Kaggle Kernels에서도 GPU를 사용할 수 있습니다 게다가

그래서 그것이 당신을위한 결정적인 요소가되도록하지 마십시오 Kaggle Kernels입니다 슬라이드로 다시 전환합시다 몇 가지 다른 작은 도구와 팁에 대해 이야기 해보십시오 그리고 속임수, 우리가 일을 마무리하기 전에

슬라이드로 다시 전환 할 수 있다면 굉장해 그럼, 당신은 노트북을 원하지 않는다고 가정 해 봅시다 예를 들어, 노트북을 사용해보십시오 그리고 그들은 단지 당신을위한 것이 아니 었습니다 또는 더 큰 작업 부하가 있습니다

장기 실행 작업을해야합니다 몇 시간 동안 뛰게됩니다 아니면 정말 큰 데이터 세트를 가지고 있거나, Kaggle Kernels에 맞지 않습니다 또는 로컬 디렉토리에 맞지 않는 경우, 그래서 수동으로 드라이브에 업로드하지 않을 것입니다 그런 다음 Cloud Machine Learning Engine과 같은 것을 사용할 수 있습니다

당신은 일자리를 차출 할 수 있습니다 – 장기간 일하는 – 분산 된 컴퓨터 집합을 가로 질러 실행될 수도 있습니다 모두 잠재적으로 GPU가 첨부되어 있습니다 일단 끝나면 모델을 제공 할 수 있습니다 당신은 그 예측을하고 싶다 그러나 아마 당신은 그것을 대규모로하고 싶습니다

당신은 앱을 만들고 있습니다 모델을 훈련하고 생성하려고합니다 세계에 예측을 제공 할 수있는 휴식 종점 그리고 기계 학습 엔진 또한 자동 스케일링 예측 서비스가 포함됩니다 글자 그대로 TensorFlow 모델을 사용할 수 있습니다

그것에게 이름을주고, 끝내라 말 그대로 파일을 가리키고 이름을 지정하십시오 다른 단계는 없습니다 왜냐하면 봉사 할 모델을 만드는 관점에서 다른 일은 할 수 없다 그것은 정말로 산뜻하다

그리고 당신이 scikit-learn 같은 것들로 작업한다면 또는 [INAUDIBLE] 부스트를 선택하고 해당 서비스를 제공하려는 경우, 우리는 그것들을 또한 가져갈 것이다 그래서, 당신은 작전을 처리 할 필요가 없습니다 기계 학습의 측면에서, 당신은 당신의 데이터로 놀 수 있고, 모델을 조정하고, 교육하고, 쉽게 배포 할 수 있습니다 그리고 나는 대부분이 대부분은 아니지만 많은 사람들이 기계 학습 API를 알고있을 수도 있습니다

또한 사용할 수 있습니다 이들은 다양한 작업을 수행하기 위해 사전 설정된 API입니다 그들은 좀 더 통조림입니다 자신의 데이터를 제공하지는 않지만 모든 것이 그냥 상자에서 작동한다는 것을 의미합니다 너는 뭔가가 필요해

너는 돌릴 그림이 필요해 설명으로, 당신은 텍스트로 바뀌어야 오디오가 필요합니다, 그냥 작동합니다 그래서 친절 해 그러나 물론 제한 사항은 사용자 정의 할 수 없다는 것입니다 귀하의 특정 사용 사례

아직 기다려야 할 것이 있습니다 조금 더 길어 Vision의 주목할만한 예외가 있습니다 따라서 자동 ML, Vision은 현재 알파에서 사용 가능하며, 그래서 당신은 그것을 신청할 수 있고 자신의 데이터를 제공 할 수 있습니다 자신의 Vision API를 교육하고 맞춤 설정합니다

그래서 그것은 깔끔한 측면 접선과 같습니다 이전에 보았던 애니메이션, 나는 오렌지와 파란 점들과 함께 보여 주었다 TensorFlow 놀이터에서 왔습니다 그래서 신경망으로 놀고 싶다면 귀하의 브라우저에서와 같은 것들을 토글 켜고 끄기 장난 만하면됩니다 TensorFlow

org 그리고 바로 그 일을 할 수 있습니다 그리고 걱정하지 마라, 당신은 그것을 깰 수 없다 브라우저를 통해서만 가능합니다 자신의 기계 만 깰 수 있습니다 그러면 다음은 무엇입니까? 우리가 방금 본 코드는 – 나는 그것을 공개했다

그것은 Kaggle 위에 있습니다 그래서 Kagglecom/yufeng/zoo-demo에 있습니다 TensorFlow에 대해 더 자세히 알고 싶다면, TensorFloworg로 향하십시오

셋째, 기계 학습 과정이 있습니다 구글이 최근에 발표했다 그리고, 만약 당신이 배우고 싶다면 – 정말로 잠수해라 기계 학습의 개념으로, 우리가 오늘 여기에서 이야기했던 것보다 더 멀리 나아 간다 저기로가

기본적으로 전체 커리큘럼이 있습니다 할 수있는 동영상 및 과제에 대해 기계 학습 지식을 축적하십시오 그리고 마지막으로, 기계를 다루는 데 관심이 있다면 클라우드에서 학습하면 넘어갈 수 있습니다 클라우드 돔, 하얀 텐트에 Google Assistant 돔 옆에 있습니다 또는 cloud over

Googlecom/mineinelearning으로 이동하십시오 또는 / ml이다 처음에 언급했듯이, 저는 비디오 시리즈를 호스트합니다 AI 모험과 같은 이름으로 우리는 재미있는 너겟을 탐험한다

기계 학습에 관한 각 에피소드에서, 한 번만 실습 데모를 시도해보십시오 흥미로운 사람들과 몇 차례 인터뷰를합니다 그래서 잘하면 당신은 그것을 확인하고 구독 할 것입니다 이 세션에서 저와 함께 해 주신데 대해 감사드립니다 우리는 정말로 – 세션에서 피드백을 정말 고맙게 생각합니다

정보, 그래서 일정에 이상 머리에하시기 바랍니다, 로그인하여 몇 가지 피드백을 줄 수 있습니다 고마워 [박수 갈채] [음악 재생]

Google’s Deep Mind Explained! Self Learning A I

гледаш Хладну Фузију ТВ Поздрав на још један Хладну Фузију видео први пут у историји видети успешан развој и демонстрацију АИ опште намене име је алфаго и направљен је гугловом дубоком поделом алфагом АИ алгоритам јотукао човека на свету, најтежа игра ово је историјски тренутак у компјутерској науци и вештачкој интелигенцији, па шта тачно је Гугл дубоко одакле је дошло и шта је компанија вештачка интелигенција заправо ради у овом видеу, сазнаћемо рачунарски програм потукао је људски мозак древне кинеске игре завршна школа за једну тријумфальу вештачку интелигенцију опремљену људска интуиција пообеда програма над људима у древној игри на табли покренуо интригу и у неким случајевима брине о томе показује машину приближно одговарати људској интуицији и надмудрио најбољи људски мозак у игри то је нешто што научници нису очекивали да ће се десити бар још једну деценију и то је огроман скок завештачку интелигенцију која показује то машине могу саме научити Мислим да је можда игра завршила зато што изгледа изгледа да ова два рачуноводства не мислим да сте поднели оставку

Вов мислим да сте у праву си ово је бео тренутак када јечунар заван алфато потукао мајстора древних Кинеских игара није то први пут када је Велики Мајстор понизио машину, али оно што чини алфагом другачије је то што је то прва демонстрација да машине стварно могу да науче и размишљају на љусски начин, победу Алфа-а је шокирана стручњаци у вештачкој интелигенцији многи сматрају да је такав догађа био бар једну деценију, па прво неколико питања зашто је то важно и шта је све шупље алфато показује да машине стварно могу науче како тако добро науче уместо тога да користите расный силу да бисте израчунали све потезе може направити као претходно а алфаго користи учење јјчања и неуралне мреже које имитирају процес учења људског мозга имају на уму да Древна кинеска игра има много више могућих потеза од шаха колико и постоје атома у читавом универзуму, тако да нема начина да само израчунате све могуће је је кретање на табли што је ректично немогуће из овог разлога свети грал је АИ-а и вети да уарадимо такав задатак од огреботине је огроман Подизање ове дубоке умове креатори кажу да алгоритам може научити много више ствари без промене или смерница, другим речима, АИ је општа сврха увек смо говорили о томе шта ако бисмо на крају могли да пукнемо 그 (것)들과 изумети неке генеричке алгоритме опште намене тако да су пукли на ваху све то ако питате чудног играча због чега играју одређени потез понекад ће вем само рећи да се осећат у праву, тако да можете на један начин како бисте могли мислим да је то много интуитивнија игра, док је шах много више логике засноване игре тако да је дубок ум гугла дубоког ума је британска компанија за вештачку интелигенцију која је основана у септембру 2010 године као дубока уметност 2014 년 Гугл купио пуеменоване су када јехнологије године за пет година Стотину милиона долара занимљиво је било тек након тога Фејсбук је тек завршио преговоре са њима 2013 године и још једна забавна чињеница да је Елон Муск заправо инвеститор у компанију да их пратимо, наравно, дубоко је добио компанију године аадраду компјутерске лабораторије у Кембрџџу у 2014 години, тако да се дубок ум долазећи од дубоког ума, први пут јекренуо суоснивач од стране Демиса Хасабиса 2010 године Денис је био дечији геније различитих врста и отиша је ое шаховског чуда и достигавши мастер ниво у 13 години да постане водећи програмер Главе лав-а Студија за револуционарне игре попут црно-белих након што је наставио започети сопствени студио за игрице пре одласка да заврши додатне студије Универзитетском колеџу Л Лондону, овде ће се сусрести с будућношћу 2010 년에 кофунтери дубоког ума у

па какав је цен циљ дубоких технологија према њиховој веб страници њихов циљ јешити интелигенцију коју покушавају постићи ово комбиновањем најбољих техника из машинског учења и системске неуронауке за изградњу моћних алгоритама учења за општу намену или другим речима, желе формализирати интелигенцију сазнати шта је то и како функционише завршна игра није само да се имплементира ово у машине, али и разумеју демос људског мозга објашњавају даље цитира се покушај днсеиигенције у алгоритамски конструкт може се доказати да будемо најбољи пут до разумевања неких трајних наших мистерија На крају крајева цраа кључ је овде да је ова машина општа намена веома важно, али више о овоме касније, па како ово све функционише од АИ дубок ум користи технику под називом дубоко учвршћивање учења која га чини веома другачији од других АИС-а, као што је ИБМ Вотсон или примитиви теорија или Гугл сада се управо помиње само за предефинисана сврха и једина функција унутар њиховог делокруга, њиховог опсега дубине ума тврди то њихов систем није унапред програмиран и сазнаје из искуства користећи само сирове пикселе као улаз података тако да начин на који почињемо са тренингом алфаго је приказивањем а сто хиљада игара се играју јаки аматери које имамо преузели са интернета и прво у почетку добијамо алфаг имитирају људског играча, али наравно у крајој линији желимо алфаго ће бери јачи од људских аматера и да се такмиче са врхом стручњаци, тако да начин на који то радимо је када пређемо на ту прву верзију Научимо да имитирамо људску игру, онда му дозвољавамо да се игра тридесет милиона пута нашим серверима и коришћењемепојачања учи се да систем учи да се побољша постепено избегавајући грешке и повејавајући и побољшавајући се њ г о в завршиш са новом верзијом која може да победи стару верзију оригиналне верзије око 1897-ме технички је јејање који дубок модел слободног значења што значи да не треба структура или скуп правила за учење према мишљењу МИТ-а, Гугл алгоритам узима у обзир неуронску мрежу у теорији треба да имају могућност приступа спољној меморији на начин који имитира краткорочно сећање на људски мозак начин да се скоро чини као наш мозак дизајн бити најефикаснији начин застварање обокалне интелигенције који би погодио, тако је све добро шта је са овим термин опште намене шта то заправо значи добро јер је машина сазнаје из искуства и података који се могу изврсити увеликој варијанти задатака изван оквира, тако да је довољно говоро да погледамо систем у акцији учење како се иерра избацити и запамтити машину није имала никаквог предзнања о томе који задатак је требало да изврши схватити како све учинити само из сопственог искуства је машина пре тренинга, ово је буквално први пут када је машина икада видела овај ток података и контролише зелену ракету овде и то је и ти можеш видети да губи своја три живота одмах, тако да је у основи ужасно на утакмици каква би сада очекивала након тренинга преко ноћи га остављамо играти преко ноћи на нормалном рачунарском рачунару тако да се око 8 сати враћа ујуро и сада је надчовек тако да сада машина може да игра просторне освајече боље него било који човек моделирао света игара тако да је знао где је просторни ток направљен ово ће бети испред времена, тако да се окупатори простора убрзају када добијете мање од њих на екрану ради ватра завршно кратак је ретер предиктивног снимка где ће бити коначни Простор Освајача за неколико секунди, али је супер ствар када схватите како играти неке игре које ће моћи пренети ово знање и разумевање на више начина 1970 년 – их година и гре у овом тренутку дубок ум тренутно играју огре од 1970-их година и 80 – их, али слам као што је страшни суд који се појавио у раним деведесетим како би могао бити АИ опште намене корисно би волели да користимоо ове врсте алгоритама за ствари као што је здравствена заштита и науку и побољшати брзину открића у тим областима помажући људски стручњаци постижу више у низу интервјуа о којима је Денис разговарао апликације у здравственој паметној асистенцији и роботици апликације за општи АИ и неке рпеикације таквог АИ укључују везу за сервис за купце компјутерске визије финансија опште рачунарске науке и објављивање вести и писање АИ опште намене у ствари би могле бити огромне сматрати као још једну научну науку која меного слична као што је јенова физика положила основе за технологије као што су ракете наука основана уопште дигиталне неуралне мреже којисте умножавајуће учење могу поставити основе за незамисливе ствари у блиској будућности Добро, тако да јетово на карайу видео-снимка, али тлаба поставити једно питање а а и т т т постојање сада је аномалија којом смо превазишли границе природе технологија која нам помаже да олакшамо такав начин живота, вештачку интелигенцију је другачији разлог зашто је АИ прва ствар коју су људи створили има тенденцију да фавани начин на који не можемо предвидети, па треба да баринемо о мојимј веровањима да страх од непознатог је углавном оно што погађа хистерију која се појављује од анксиозности у И уеннама довољно в о манну овом видеу да прође кроз све теорије о томе како ствари могу изаћи, али то је је занимљива тема унутар сама веб страница чека, али зашто је прилично занимљива и свеобухватна Погледајте АИ немамо времена да истражимо све, али чланак не подиже а а љ доживавају експоненцнјнлну промену дуго времена људи неће узимати АИ озбиљно и чини се да је напредак веома спор, а онда одједном то би могло преболети наша необуздана очекивања један од метода које АИ може искористити зопостизање овог исхода, дајући себи способости за себе побољшање тако да следи законо убизавању повратка Стивен Хокинг и Елон Муск обојица показују своје резерве према АИ, али други воле 마약 중독 филм Терминатор за тренутак постоји могућност да АИ може бити човек највећи савезник који решава основне проблеме нашој планети и дозвољава нам да имамо технологију и инфраструктуру која би нас иначе могла учинити вековима ако покушамо сами да сазнамо, али са за сари сазна постоји могућност да АИ може бити злонамерна и да ће нас надмашити, али у овој фази ми т в н н тако да уоо овом тренутку нисам забринут, али опрезно оптимистичан као за дубок ум један од њихових услова након што је Гугл купио то што они успостављају Ал Етички Одбор и мислим да ће се већина нас сложити да је то опрезно одлука у свему можемо бити у историјској тачки критичну тачку вештачка интелигенција будућност могла да види дубоко неурално Учење и генерално наменски АИ у нашим паметним телефонима и рачунарима неки кажу да можемо чак и морају почети размишљати о читавој новој економији разлога да би АИ мога преузети пуно информационих интензивних специјализованих послова које остављају само посао су креативни или емоционални у природи нешто што ја никад не бих постигао искрено не могу рећи где ће све ово водити са сигурношћу, али онда опет мислим да нико не може ако погледаш макро слику у свему овога након много деценија настојања да изграде паметније рачунаре и алгоритме Испоставило се да је најбољи план био у нашим главама све време човек мозак, тако природно, да су наши умови толико способни, зависи само од тога како ми користимо тако да је то крај видео захвалности а л л њ њ њ оставите коментар и претплатите се ако сте нови, можда бисте желели да то учините ако сте е и 10 пратите упутствта на овом екрану поздрављате момке захваљујући за гледање и видећете поново ћете ускоро за следећи видео који је добар

Detecting cancer in real-time with machine learning

[음악 재생] DR MAHUL AMIN : 암은 없습니다

병리학이 무엇인지 이해하지 않고 치료했다 마틴 스 탬프 : 그 조직은 그 병리학자를 미끄러 져합니다 암 진단에는 방대한 양의 정보가 포함되어 있습니다 그것은 매우 시간 소모적이고, 매우 피곤합니다 DR

TRISSIA BROWN : 모든 세포를 검사해야합니다 때때로 암은 인식하기가 어렵습니다 우리는 현미경 프로젝트에 대한 아이디어를 가지고있었습니다 약 1 년 전 기존의 현미경에 증강 된 현실을 제공합니다

실시간으로 암을 탐지 할 수 있습니다 우리는 AI를 사용자에게 직접 가져오고 있습니다 그들이 지금있는 곳에서 그들을 만난다 DR JASON HIPP :이게 다가올 것 같아

거의 모든 병리학 자들이 접근 할 수 있도록 기계 학습 마틴 스턴크 : 몇 주 전에, 우리는 끝까지 끝내야 해 DR JASON HIPP : 카메라가있어서보고있는 중입니다 내가 보는 똑같은 일

정보가 컴퓨터에 공급되고 있습니다 수십억의 계산을하고 있고 저에게 말하고 있습니다 그게 종양이야, 그건 종양이 아니야 마틴 스 낫프 : 지금은 유방암을 감지합니다 및 전립선 암

그러나 다른 암 종류에서도 효과가있을 수 있습니다 우리가 모델을 훈련시키는 것 당신이 얻는 지식 현미경이 암을 암시 할 때 많은 병리학 자의 지식이다 모델에 대한 기계 교육에 기여한 사람 DR

JASON HIPP : 병리학 자 팀이 있었어 수천 개의 이미지를 거쳐 암세포가 어떻게 생겼는지 컴퓨터에 가르치기 DR TRISSIA BROWN : 나는 그것이 있다고 생각한다 관심 분야를 찾는 데 매우 효과적이었습니다

그것은 두 번째 의견을 얻는 것과 같습니다 DR JASON HIPP : 그것은 의사들을 훨씬 더 빨리 만들 것입니다 그들은 그것들을 더 잘 만들 것입니다 환자에게 전반적으로 도움이됩니다

마틴 스 탬프 : 임무는 정확성을 높이는 것입니다 암 진단의 유용성 및 가용성 사람들의 생명을 구하십시오 나는 동기 부여가되는 것을 거의 생각할 수 없다

Google Cloud Platform Learning Lab with Tigran Terteryan

그것은 당신이 만든 함수를 덤프하지 않습니다 즉, 데이터베이스가 삭제 된 경우, 당신의 기능은 사라질 것입니다; 당신은 그들을 사용할 수 없습니다

다른 클라우드 플랫폼과 마찬가지로, Google 클라우드 제공 다양한 유형의 서비스 다양한 IT 인프라 그들의 서비스를 제공 할 수있다 Google Cloud Platform을 사용하여 실험실의 초점은 클라우드 기술이었습니다 학생들은 Google Cloud Platform에 대해 소개되었습니다 그들은 도구 인 gcloud를 사용했습니다 Google Cloud Platform에서 사용되었습니다

그 외에, 학생들은 반드시 Google에 묶여 있지 않은 다른 도구를 사용했습니다 리눅스 머신, 리눅스 운영 체제, 그들은 HTML, PHP, MySQL 데이터베이스, iptables 방화벽, 및 DNS 소프트웨어 도메인 이름을 설정하는 방법 연결 실험실 리더가받을 수있는 최상의 결과 학생들이 그들의 임무를 수행 할 때입니다 예상보다 훨씬 뛰어납니다 다시 같이 일하기를 바랍니다 미래에! 감사!

What is Machine Learning?

YUFENG GUO는 : 세계는, 데이터 data– 많이 가득 사진, 음악, 단어, 스프레드 시트, 동영상, 그리고 곧 언제든지 속도를 느리게 것처럼 보이지 않는다 기계 학습은 약속을 제공합니다 의 모든 데이터에서 의미를 도출하는 단계를 포함한다

아서 C 클라크는 유명 한 번 말했다, "모든 충분히 고급 기술입니다 마법과 구별 " 나는, 기계 학습 마법 수 없습니다 발견 오히려 도구와 기술이 당신을 데이터와 질문에 대한 답변을 활용할 수 있습니다 이는 클라우드 AI 모험이다 내 이름은 Yufeng의 구오이며, 각각의 에피소드, 우리는 예술, 과학을 탐구한다 기계 학습 도구를 제공합니다

길을 따라, 우리는 얼마나 쉽게 볼 수 있습니다 그것은 놀라운 경험을 만드는 것입니다 가치있는 통찰력을 얻을 수 있습니다 기계 학습의 값은이다 단지 그 자체를 보여주기 시작 생성 된 오늘날 세계에서 많은 양의 데이터가 뿐만 아니라 사람들이뿐만 아니라 컴퓨터, 전화로 및 기타 장치 이것은 단지 앞으로 몇 년 동안 계속 증가 할 것입니다 전통적으로, 인간이 분석 한 데이터 데이터 패턴의 변화에 ​​적응 된 시스템

그러나, 데이터의 볼륨으로 능가 그것의 의미를 만들기 위해 인간의 능력 수동으로 그 규칙을 작성, 우리 자동화 된 시스템에 점점 켜 것이다 데이터로부터 중요한 배울 수있는, 데이터의 변화는 이동 풍경에 적응합니다 우리는 기계가 우리 주위의 모든 학습 참조 제품에 우리는 오늘을 사용합니다 그러나, 항상 분명하지 않다 그 기계 학습은 모든 뒤에 내부 태그 객체와 사람 같은 것들 동안 사진으로 명확하게 기계가 놀이 학습, 즉시 나타나지 않을 수있다 다음 비디오를 추천하는 것은 보는 것을 또한 기계 학습에 의해 구동됩니다 모든 물론, 아마도 가장 큰 예 Google 검색입니다

당신이 구글 검색을 사용 때마다, 당신은 많은 기계 학습 시스템을 가지고 시스템을 사용하고 핵심에서, 쿼리의 텍스트에서 이해 개인의 이익에 따라 결과를 조정하는, 검색 할 때와 같은 알고로하는 첫번째을 보여 결과 자바는 커피 전문가있어 여부에 따라 대한 또는이 developer– 아마 당신은 둘 다입니다 오늘날, 기계 학습의 즉각적인 응용 프로그램 이미 상당히 이미지 인식을 포함하여, 광범위한있다, 사기 탐지 및 추천 시스템, 뿐만 아니라 너무 텍스트 및 음성 시스템과 같은 이러한 강력한 기능이 될 수 있습니다 폭 넓은 분야에 적용 소매에 당뇨 망막 병증, 피부 암 탐지에서 형태는 물론, 교통 셀프 주차 및자가 운전 차량 그것은 그리 오래 전의 일이 아니다 회사 또는 제품이 한 때 자사의 제품에서 기계 학습, 그것은 신규 한 것으로 간주 하였다 이제 모든 기업은 기계 학습을 사용하는 피벗한다 어떤 식 으로든 자신의 제품이다

그것은 빠르게, 잘, 예상되는 특징이되고있다 우리는 웹 사이트를 가지고 회사를 기대 하듯이 모바일 장치 혹은 응용 프로그램에서 작동, 때 할 날이 곧 올 것이다 예상되는 우리의 기술은 것 맞춤 수, 통찰력과 자기 교정 우리는 더 빨리 더 나은 인간의 작업을하기 위해 기계 학습을 사용할 때 이전보다 쉽고, 우리는 또한 수 미래의 기계 학습에 더 찾을 우리가 작업을하는 우리는 결코 할 수 없다 도움이 될 수 있습니다 우리 자신에 달성 할 수 있었다 다행히, 그것은을 활용 어렵지 않다 기계의 오늘 학습 툴링은 꽤 좋은 얻었다

당신이 필요로하는 데이터, 개발자와 의지입니다 돌입을 촬영합니다 우리의 목적을 위해, 나는 정의를 단축했습니다 불과 5 글자 네요까지 학습 기계의 질문에 대답하기 위해 데이터를 사용하여 나는 그런 짧은 대답을 사용하지 것이지만 시험에 에세이 프롬프트, 그것은 우리를 위해 유용한 목적을 제공 이리 특히, 우리는 두 파트로 나뉘는데으로 정의를 분할 할 수 있습니다 데이터와 대답 질문을 사용 이 두 작품은 크게 두 가지 측면 개요 기계에 둘 다 똑같이 중요 학습

데이터를 우리가 훈련으로 참조 무엇인가하여, 질문에 대답하는 만들기로 언급되는 동안 예측 또는 추론 이제 조금에 대해 간략하게 그 양쪽에 드릴 수 있습니다 교육은 우리의 데이터를 사용을 의미 생성 및 예측 모델의 미세 조정을 통보합니다 이 예측 모델은 할 수있다 과거에는 볼 수 없었던 데이터에 대한 예측을 제공하는 데 사용 그 질문에 답합니다 더 많은 데이터가 수집 될 때, 모델 구축 시간과 새로운 예측 모델을 통해 향상시킬 수있다

여러분도 알다시피, 핵심 구성 요소 이 전체 프로세스의 데이터이다 모든 데이터에 달려있다 데이터는, 기계 학습을 잠금 해제의 열쇠입니다 기계 학습만큼 잠금 해제의 열쇠입니다 데이터에 숨겨진 통찰력 이것은 단지 높은 수준의 개요이었다 이 유용한 이유의 기계 learning– 및 해당 응용 프로그램의 일부 기계 학습은 광범위한 분야입니다, 기술 할 때의 전체 제품군에 걸쳐 데이터에서 답을 추론

미래의 에피소드 그래서, 우리는 당신을 제공하는 것을 목표로합니다 접근 어떤 좋은 감정 주어진 데이터 세트 및 질문에 사용할 당신은 대답뿐만 아니라 방법에 대한 도구를 제공 할 이를 달성하기 위해 우리의 다음 에피소드에서, 우리는 바로 뛰어들거야 기계 학습을하는 구체적인 과정에 보다 상세하게, 방법 단계별 화학식 거치지 기계 학습 문제에 접근한다 [음악 재생]

Past, Present and Future of AI / Machine Learning (Google I/O ’17)

[박수 갈채] 다이앤 그린 (Diane Greene) : 안녕하세요, 여러분 나는 다이앤 그린입니다

나는 구글의 놀라운 클라우드를 실행합니다 나는 알파벳의 보드에있어, 나는 오늘 매우 자랑 스럽다 여기에 단지 절대 선도의 패널을 완화한다 전문가, 선도 연구자 및 전문가 인공 지능과 기계 학습한다 우리는 우리의 패널을 구성하는거야 과거, 현재, 미래, 폐쇄에 대해 이야기 업계에 대한 몇 가지 개인 반사 우리의 경력 내가 그렇게하기 전에 그리고, 난 그냥 갈거야 신속하게 모든 사람을 소개합니다 우선 프랑소와 Beaufays입니다

그녀는 구글의 수석 과학자의 구글의 음성 인식의 지도자이며, 뭔가 모두 사용합니다 [박수 갈채] 구글 십이년에 있었다 둘째 페이 페이 리이다 그녀는 Google 클라우드의 수석 과학자이다 [박수 갈채] 전 세계 기업에 AI와 ML을 현실로, 또한 스탠포드 대학의 인공 지능 연구소의 머리와 발명가 imageNet 및 imageNet 도전의, 정말 우리의 개발의 일부에 기여하는 깊은 학습과 AI있다

그리고 그녀는 STEM과 AI의 챔피언이기도 및 전체에 대한 AI의 설립자 다음으로, 페르난다 비에 가스? 그녀는 구글 수석 직원 연구원의 그녀는 계산 디자이너의 그녀 과학적이고 협력적인 측면에 초점을 맞추고 정보 시각화, 큰 그림 데이터를 공동-리드 시각화 그룹, 그녀는, 구글 뇌의 일부 그녀는 또한 그녀의 시각화 기반의 작품에 대한 알려져있다, 이는 박물관의 영구 컬렉션의 일부입니다 뉴욕 현대 미술관 [박수 갈채] 그리고, 내가 다프네 콜러을 소개하자 사람들 오늘 옥양목, 옥양목 연구소에서 수석 컴퓨팅 책임자 인 알파벳의 일부 사람들을 제공하기 위해 노력하고있다 이상과 건강한 삶 그녀는 Stanford–에서 18 년을 보냈다 그녀가 거기에 AI 그룹을 주도, 그녀는 공동 출자 MOOC의 가장 큰 플랫폼 코 세라, 대규모 온라인 courses– 온라인 강좌를 엽니 다 그리고 당신은 알고있다, 다프네는 "타임지의 '중 하나였다 2012 년 가장 영향력있는 100 명, 그녀는 맥아더 재단 상을 수상 그녀는 컴퓨팅에 취임 ACM 상을 수상 그녀는 아카데미 예술 및 과학 아카데미의 회원입니다 Engineering– 그리고 사람들은 단지입니다 그녀의 우수성을 증명 점의 일부

[박수 갈채] 그래서 우리는 역사적 관점으로 시작합니다 그리고 다프네, 가장 유명하고 많은 글을 쓰는 저자 중 한 명으로 기계 학습 연구 논문, 당신은 우리가했습니다 방법에 저희에게 당신의 관점을 제공 할 수 있습니다 깊은 학습으로 전환? 다프네 콜러 : 그래서 깊은 학습 혁명을 생각한다 오늘날 우리가보고있는 정말 흥미로운 원동력이다 많은 실제 문제의 많은 부분이다 그러나 혁명은 부산물에서 나온 그것까지 이어질 기계 학습 연구의 많은 깊은 학습 그래서 이전에, 아마 있었다 개발 모델에서 매우 힘든 일 약 10 년, 15 년 그것은 어쩌면 손으로 조작했다 즉, 더 많은 생각과 더 많은 사전 지식이 필요합니다 그리고 우리는 정말로 특성을 통해 동기화했다 모델과 방법의이 도메인에 관한 것이다

당신은 많은 양의 데이터가없는 경우 때문에, 당신은 인간의 직관의 많은 것을 교체해야 방법에 대한 모델이 구축되어야한다 우리가 특정 도메인에서 더 많은 데이터를 입수 한 것처럼, 텍스트와 이미지는 내가 두 개의 주요 examples– 생각되는 음성 물론, 저기 등 우리는 인간의 통찰력이 필요로 많이 대체하기 시작했습니다 그것을 상쇄 점점 더 많은 데이터를

하지만 그 10 또는 15에서 개발 된 기술 세 방법 모두에서 오늘날에도 여전히 중요한 있습니다 개발 된 그 최적화 알고리즘을 themselves– 지난 10 또는 15 년 동안 여전히 깊은 학습을 할 수 있습니다 무엇의 핵심 구성 요소는 성공합니다 그리고 나는 우리가 좋아하는 반면 생각 빅 데이터는이 시점에서라고 생각합니다 모든 것에 대한 해결책은, 그것은 특정 도메인의 솔루션입니다 지역은하지만, 다른 사람, 우리는 여전히 불행하게도이다 매체 또는 때로는 작은 데이터 정권한다 그래서 그들은 확실히 여전히 필요있어 데이터를 사용하여 도메인에 대한 인간의 직관의 균형을위한 획득하고 모델과 함께오고 있었다 그 그 모두의 최고의 통합합니다 다이앤 그린 (Diane Greene) : 감사합니다 그리고 페이 페이, 우리는 또한 당신의 관점을 얻을 수 있나요? 당신은 스탠포드 인공 지능 연구소를 실행 당신의 imageNet 작업은 독창적이었고, 지금은 bringing–있어 당신은 세계 모든 회사에 AI를 가져 찾고 있습니다

어떻게 그 변화와 함께 일이야? 페이 페이 리 : 네 , 다이앤을 주셔서 감사합니다 역사적 관점 그래서 조금 인류 문명의 모든 과학에서 AI가 실제로 아주 어린 분야이다 우리는 약 60 세,하지만 매우 질문 정보에 대한 탐구의, 내 의견으로는, AI의 영감의 루트에 무엇이다 그리고 그 시작부터 거슬러 올라 문명의 새벽

그래서 약 60 년 전, 기계 시작했을 때 계산하고 그 시간에 계산 아주 간단한를 arithmetics, 앨런 튜링 (Alan Turing)처럼 이미 사상가 질문과 인류에 도전, 기계는 생각할 수? 기계 지능을 가질 수 있습니까? 그래서 약 60 년 전, 최고의 컴퓨터 과학자 마빈 민스키, 조 맥카시, 그리고 많은 다른 이들처럼 함께있어 정말 필드 – 시작 점프 오늘 우리는 AI로 알고있다 인공 지능 창시자는 봤다고 기술적으로 육십년 전에 매우 달랐다 그러나 기계를 만드는 동일한 코어 꿈이었다 배우는 이유에, 생각, 말을, 인식하는, 통신합니다 그리고 AI는, 기술 개발의 여러 파도를 거친 전문가 시스템에 첫 번째 순서 논리에서 today– 학습 기계의 초기 파도 깊은 학습 혁명 나는, 나는-체외 AI를 호출, 지난 육십년 말할 것 또는 AI 체외

그것은 필드로,이 60 년이나 우리는, 우리가 물어 질문의 토대를 마련 같은 AI의 탐구에 필수적인 서브 필드, 로봇 공학, 컴퓨터 비전, 자연 언어 처리, 음성 처리 [? 완?]? 바이오,?] 등등 그러나 또한 우리가 진행 상황을 측정하는 방식은 우리의 데이터를 이해하기 및 도구 세트를 발견 할 수 있습니다 그래서 2010 주위에, 그 시간의 주위에, 감사 융합에 통계적 기계 학습 도구의 성숙의, 빅 데이터의 융합은 우리에게 가져 인터넷에 의해, 그리고 센서에 의해, 컴퓨팅의 융합은 무어의 법칙은 우리를 실시한 더 나은 하드웨어 이 세 기둥은 함께 온 그리고 시험관 단계에서 AI를 해제 나는 생체 단계 부르는로 AI는 세계에 실제적인 영향을 어디에 AI는 생체 내이다

그것은 시작에 불과합니다 모든 단일 산업 클라우드에서, 구글, 우리는 때문에 데이터의 변환을 겪고 참조 AI, 기계 학습 때문이다 그리고 이것은 내가 역사적 순간으로 볼 것입니다 AI는 충격과 필드를 변환려고하고있다 그러나 나는 또한 시작에 불과 말하고 싶지 않습니다 도구 및 기술 우리 AI의 분야에서 개발 의 광대 한 바다에 물이 정말 처음 몇 방울 무엇 AI는 할 수 있습니다

우리는이를 통해-약속 할 수 없지만, 엄청난이 있어야한다 흥분 우리가 할 수있는, 더 많은 작업이 AI를 만들기 위해해야 ​​할 일 생체 내 발생 다이앤 그린 (Diane Greene) : 당신의 흥분을 공유 할 수 있습니다 이 생체 상태, 나는 회사를 의미 클라우드에서 자신의 가상 표현으로 퍼팅 그리고 그들은 AI를 사용하는 것을 아무도 이제까지 생각을 할 수 없습니다 가능했다 그리고 AI의 존재가 아니라 클라우드에서, 모든 곳에서 사용된다 그래서 감사합니다 우리가 좀 더 깊이 잠수하면, 프랑소와, 이제 음성 인식과의 국경에서 봤는데 애플리케이션에서 음성 인식 실제로 거의 일반화되고있다

당신은 전환을 통해 우리를 데려 갈 수 있습니까? 프랑소와 BEAUFAYS : 예, 확실히 그래서 나는 약 12 ​​년 전 구글에 합류했다 그리고 우리의 무리는이 비전과 함께 의 음성 인식 유용 뭔가 재미있는 일입니다 음성 인식은 아주 잠시 동안 주위에 있었다 우리 모두는, 현장에서 몇 가지 배경이 있었다 그러나 우리는 뭔가 재미를하고 싶었다

연설이 지금 품질 없었기 때문에 그게 어려웠다 그래서 우리는 매우 한정 상품으로 시작 위치를 인식하는 작업이 어떤 사람이 말한다 너무, 너무 복잡하지 않았다 우리는 조금 봉투를 밀어 노력하고 있었다 하지만 많은 우리는 장소에 가져다 필요하기 때문에 이 제품은 사람들이 원하는 것을 충분히 성공 곳 우리의 응용 프로그램을 사용하고하는 우리 모델에 데이터를 접는 시작할 수 거기에서 거래를 유지 그래서 우리는 우리가 GOOG-411라는 것을 만들었습니다

당신의 그 기억 나도 몰라, 하지만 그냥 전화 응용 프로그램이었다 이봐, 당신은 번호로 전화를 걸 것이고, 그것은 말할 것 어떤 도시와 국가? 그리고 당신은 당신이 관심이 무엇인지 말할 것입니다, 다음은 비즈니스에 대해 물어 것 있는지에 관심이 있었다 그런 다음에게 그것을 그 이름을 말할 및 것 그 도시에 그 사업을 연결하기 위해 제공하는 것입니다 및 상태 그래서 다시, 그것은 12 년 전입니다 그림 어떤 아이폰, 아니 안드로이드 폰은 없습니다, 당신이 가지고있는 모든 작은 플립 폰이 귀에 넣어하는 것입니다

그래서 아주 기본적인했다 다행히 구글의 리더십 이 기술은 정말 환상이었다 정말 경계를 밀어 우리를 격려 우리가 할 수있는만큼 그래서 우리는이 첫 번째 응용 프로그램과 함께 성공했다 하지만, 아이폰과 안드로이드 폰 온, 그래서 모든 것을 분명히 바뀌었다 지금 시각적 피드백이 있었다

그래서 우리는 다른 응용 프로그램에 대해 생각하기 시작, 그리고 그 목소리 search– 그래서 구글은 음성으로 검색 할 수 있습니다 그리고 우리는 받아쓰기를하고 가지고 시작 가능한 모든 항목에서 약간의 마이크 당신이 모든 것을 할 수 있도록, 귀하의 휴대 전화에서 지적 당신의 목소리와 함께 그리고 최근에, 우리는 시도로 이동했습니다 가정 내에서 음성 인식을 사용하려면 Google 홈 같은 장치 때문에 사람들은 점점 더 많은 작업을 요구하고 음성을 통해 충족되어야, 그건 정말 좋은 항목이었다 대신 전체 지원의 이야기를 가리키는 단지 음성으로 아주 작은 일을 할 수 있도록 지금 당신은 질문이 문구를 수 요청할 수 있습니다 자연 언어에서, 당신은 정말 얻을 수 있습니다 구글은이 성가신없이 조수합니다 물리적 키보드 입력

다이앤 그린 (Diane Greene) : 감사합니다 페르, 당신은 민주화 데이터를 원했다 시각화, 그리고이 종류의 불가분의 데이터에 연결합니다 당신은 얼마나셨어요? 데이터 시각화 분석에 표시되는 요구 사항은 무엇입니까? 그리고 어떻게 진화이야? 페르난다 비에 가스 : 네, 그래서 시작 10 년 전 데이터 시각화에서 작업 내가 한 때, 훨씬 달랐다 또한, 데이터 시각화를 수행하는 것이 훨씬 더 힘들 었어요 기계는 거의 좋지 않았다 거기 밖으로 많은 데이터가 없었다 그 공개했다

즉 변화하기 시작, 지금 우리는 환경 곳에서 자신을 찾을 수 사람들은 데이터 시각화와 상호 작용 종류의 모든 곳 정말 흥분 그것은보고 정말 대단 했어요, 같은 저널리즘 데이터 시각화와 이야기에 걸릴 정말 복잡한 이야기 ​​할 때 그들은 통계에 대해 이야기 우리는 항상 데이터 시각화를 농담 통계에 해당 게이트웨이 약물의 일종이다 통계를하고있는 것입니다 심지어 우리가이기 때문에 당신이 것을 몰래 패턴과 이상 값을 따기에 시각적으로 너무 좋아 기타 등등

그래서 데이터 시각화는 이러한 추세에있다 더 민주화되고 또한, 난 정말 사람들이 잔 마셔요 있다고 생각 우리는 사람들의 능력을 증가하고있다 데이터 및 수리에 걸릴 수 있습니다 그리고 데이터 시각화는 점에서의 역할을했다 AI의 관점에서, 정말 재미있었습니다 우리는 큰 점프를 보았 기 때문에 때 제프 힌튼 및 동료 블록버스터 시각화의 첫 번째 종류의 제안 AI, t-SNE합니다

그것은 너와 수있는 기술이다 그래서 AI와 기계와 큰 과제 중 하나 학습이 매우 작동 시스템이 있다는 것입니다 고차원 공간 인간이 이해로 그리고 그 우리를 위해 정말 열심히합니다 그래서 시각화는 피크의 정렬 할 수 있습니다 한 방법입니다 이러한 시스템에서 무슨 일이 일어나고 있는지 이해하려고 노력 그리고 같은 것과 이러한 기술, 그 제프 힌튼 개발 us– 수 있습니다 그들은 우리 일종의 이해 할 수 있도록 어떻게 일을 함께 클러스터링, 다른 개념들 사이의 관계는 무엇인가, 그리고 시스템은 종류의 데이터들은 그 해결 방법 섭취한다 그래서 나는이 major–이었다라고 말하고 싶지만 거기에 큰 진전이 있었다, 그리고 beginning– 페이 페이가 말한대로, 나는 같은 느낌도 있었다 방법 사이의 관계의 시작 부분에서 시각화는 AI 도움이 될 수 있습니다

다이앤 그린 (Diane Greene) : 감사합니다 이제 우리는 조금 더 기술적 인 세트로 전환하는거야 현재에 무슨 일이 일어나고 있는지에 대한 답변 프랑소와, 어쩌면 우리는 당신과 함께 시작합니다 및 음성 인식 기술에 대한 이야기, 무슨과 전환이되어 그리고 도전 무엇인가, 그들은 오늘날 무엇인가 도전은 어떻게 진화? 네 프랑소와 BEAUFAYS : 네, 확인하십시오

그래서 음성 인식은 바로, 정말 복잡하다? 그것은 당신이 무슨 말을하는지 인식하기 어렵다 우리 각자는 다른 목소리 다른 악센트가있다 우리는 서로 다른 환경에서 말할 수 있습니다 그래서 모든 음성의 풍요 로움에 기여하고있다 그리고 그 이유로 대부분의 생각, 음성 인식은 항상 기계 학습에 기반하고있다

이 없었다, 또는 많이하지 않은, 기계 학습 기반에 있던 이전 단계입니다 이 기계 학습의 단지 유형입니다 시간이 지남에 따라 진화하고있다 그리고 우리는 마지막 세의 분야에서 진전을 보관 수십 년,하지만 난 하나의 변곡점을 생각한다 포인트는 신경 네트워크를 채택하고있다 그리고는, 어쩌면 8 년 전 정도 일이있다 어쩌면 조금 덜 그러나 음성 인식의 초기 연구 사용 신경망은 오래 전에 시간이 일어났다

분야에서 많은 활동이 있었다 유망한 결과가 많이 있었다; 그러나, 완전한 지원이 아니었다 정말로 그렇게 할 그리고 신경망은 조금 잠시 포기했다 음성 인식은 개선 유지 가우스 믹서와 같은 기본적인 방법과 모델과 이것 저것 우리가 시작했을 때 그리고 정말 깊은 신경망으로 진화 그것은 엔지니어링 관점에서 큰 노력을했다 우리는 대기 시간 문제를 처리했다, 등 교육 기능 및 규모와

그리고 결국, 깊은 신경망 때 우리가 정말 우리가 그들을 출시 할 때, 현실이되었다 경로를 열어 그, 생산을했다 다른 개선 사항의 전체 무리에 이제 때문에, 우리는 능력이 있었다 의 기술 뒤에 거기 복잡한 기계를 가지고 그래서 우리는 매우 신속하게 움직일 수 하나 개의 신경 구조에서 다음에 그래서 우리는 재발 성 신경 네트워크를 조사하기 시작, 같은 LSTM, 우리는 회선 신경에 보였다 networks– 그래서 시퀀스 CTC 기반 modeling– 우리는 시퀀스 모델링의 전체 무리가 새로운 구현오고 Google 홈으로, 우리는 신경 빔 형성 있습니다

그래서 본질적으로, 무슨 일이야 상기 뉴럴 네트워크로 이동하는 것입니다 공간이 놀라운 능력을 열었습니다 핵심 기술을 혁신하기위한 그 힘을 우리의 시스템과 최적화주고 유지 여러분은 어느 언어로 당신이 말하는 것, 우리가 할 수있는 최선의 정확성 다이앤 그린 (Diane Greene)은 : 음성 인식에 대한 확인을 잘 신경망 우리의 삶을 확장하고 우리가 건강하게 만들기위한 신경망에 당신을 위해 매우 개방적인 질문, Daphne– 왜 옥양목는 세계에서 최고 연구자 중 하나를 필요로 하는가 분자 biology–에서 당신은 또한 생물 컴퓨팅 및 기계 학습을 알아? 최고 컴퓨팅 책임자로서, 당신은 거기 뭐하는거야? 다프네 콜러 : 당신의 그래서 많은 사람들이하지 않을 수 있습니다 우리가 있었던 때문에 옥양목 알고 레이더에서 조금 그래서 옥양목는 알파벳 회사 중 하나, 첫 번째입니다 구글에서 회전했다 그리고 그것은 노화의 문제를 이해하는 것을 목표로 사람들이 더 건강한 삶을 살 수 있도록 도와줍니다

당신이 노화를 볼 때 이제 실현 것을 실제로 죽음에 대한 하나의 가장 큰 위험 요인이다 그리고 당신이 그것에 대해 생각하면 그 재미의 종류를 보인다 알고, 하지만 거의 모든 질병에 대한 사실 그 40 세 이후에 발생합니다 나이가 성장함에 따라 그, 해마다, 기하 급수적으로 그 질병 증가의 위험 매년, 그것은이든 당뇨병 또는 심혈관 질환, 암 이 모든 기하 급수적으로 증가한다 그 이유는 아무도 모른다

왜을하다 40 세 이후 삶의 모든 년 우리는 이러한 질병의 각각에 대한 위험이 증가 박았? 그리고 위해 우리 정말, 그것을 이해하기 생물학적 시스템을 연구 할 필요가 분자 수준에서 노화가 전시 시스템 레벨을 통해 모든 방법 그것은 그 나이에 우리의 원인이 무엇인지 파악 나는 우리가 영원히 살 수있을 거라 생각하지 않기 때문에, 하지만 어쩌면 우리는 개입에 의해 더 이상 건강하게 살 수 있습니다 우리의 최초의 과학자 중 하나 인 신시아 케년, 누가, UCSF에서 옥양목에 와서 보여 주었다 단일 유전자 변이 선충류 선충, 당신은 그것의 수명을 연장 할 수 있습니다 50 % 30 %처럼 뭔가에 의해 그리고뿐만 아니라 웜은 더 오래 살고 않습니다 이 점에서 건강하고 젊은 벌레 인 것처럼 살아 등 생식 건강과 운동, 그리고 그래서 우리는 그런 일을 할 수 있습니까? 즉 인간이 건강하게 살 수있는 것? 그래서 정말 멋진 것,하지만 순서대로 그렇게, 이해의 전체 많이는 우리가 여전히있다 얻을 필요가있다

그리고 그렇게하기 위해, 우리는 데이터를 수집해야 에 대한 모든 시스템, 모두 나이 효모 연령, 웜 시대, 파리, 쥐, humans– 우리 모두가 분자 수준에서 공통적으로 가지고있는 것이 무엇입니까? 그래서 다행히, 과학자들은 지난 20 이상, 수 있었다 년, 측정 양식의 전체 회전을 고안하기 즉, 적어도 우리가 이해를 얻을 수 있도록, 또는 시스템에 관한 데이터, 그들은 나이 그리고 그 순서와 같은 기술을 포함 그리고 로우 레벨, 영상에서 미세 유체, 장치 같은 것들에 이르기까지 모든 방법 그 트랙 이동하고 웨어러블 허용 움직임을 추적하고 나이 시스템이 어떻게 변경되는지 확인합니다 그러나 어떤 사람은 능력이 없습니다 함께 서로 다른 양식에서 데이터를 넣어 그 세포 내에서 모든 방법을 다양 전체 인구에 이러한 모든 다른 양상이 그래서 DNA 및 RNA와 질량 분석, 및 이미지 등을 포함한다

세포 내에서 포함되는 시간 규모의 모든 전체 인간 수명의 비늘에있는 모든 방법을 확장 할 수 있습니다 어떻게 이러한 모든 배치해야합니까 나이가 우리를 만드는 것의 일관된 그림으로 어떤 개입 될 확률이 매우 높습니다 그 노화를 둔화과 더 나은 제작에 성공? 데이터를 해석하고 그것의 사용을 만드는 그 능력 그래서 정말 진정한 협력이 필요 수집하고 점점 과학자 사이 이러한 프로세스와 시스템에 대한 직관 구성 할 수 있습니다 배우는 사람들 합성과 함께 모든 것을 넣을 수 있습니다 모델 그리고이 지역 사회의도 자체에 성공할 수 있습니다 나는이 필드를 입력 한 행운의 사람들 중 하나였다 매우 초기 단계에있다 그래서 전산 생물학의 분야에서 일한지 2000 년대 초반에입니다

그리고 같은 반면, 당신은 말할 수 나는 기계 학습의 언어 기본임을, 당신은 내가 유창을 가지고 말할 수 생물학적 언어이다 그리고 같은, 그것은 나를 작업 할 수 있습니다 로에게 옥양목의 과학자들은 만듭니다 이 두 분야 사이의 진정한 협력 그리고, 앞서 언급 한 바와 같이, 모델을 구축 모두의 가장 최고의 worlds– 결합하는 것이 중요하다 인간의 직관의 가장 좋은 또한 빅 데이터, 그러나의 나는 생각하지 않는다 생물학의 복잡 때문에 심지어 오늘날 우리가 수집하는 데이터의 양으로, 우리는 데이터에서 노보 생물학 드를 재구성 할 수 있습니다 혼자 당신은 데이터가 필요하지만, 당신은 또한 일부의 직관이 필요합니다 세계 최고의 과학자 그리고 옥양목 같은 장소에서 함께 작동 그렇게함으로써, 우리는 그 통찰력의 일부를 얻을 수 있습니다 뿐만 아니라 데이터의 엄청난 양의 일부로서 그 현재 수집되고있다

그리고 정말 구성하기 위해 나중에 다시 올 것이다 노화의 생물학에 대한 깊이있는 이해 동시에 시도하고 예측 어떤 개입은 도움이 될 수 있습니다 다이앤 그린 (Diane Greene)은 : 다프네를 주셔서 감사합니다 나는 우리가 일시 정지한다고 생각한다 깊은 생각을 많이합니다 [박수 갈채] 당신의 모자에 만요! 우리는 비전에 다시 뛰어 것입니다

그냥 다른 일 페이 페이, 당신 말을 테크 크런치 (TechCrunch)에서 인용했다, "비전은 AI의 킬러 응용 프로그램입니다" 그래서 당신은 무엇을 의미합니까? 그리고 AI, 어떤 수행을 민주화하기 위해 무엇을 의미 하는가 클라우드와 함께해야 그? 페이 페이 리 : 네, 그래서 네, 사실이었다 노력하는 것은 도발, 그리고 나는 그것을 대기합니다 인용문은 많은 사람들이 요구하는 동안,이다 컴퓨터 비전의 킬러 애플리케이션을 위해, 나는 살인자의 비전은 AI의 킬러 애플리케이션이라고합니다 그래서 나에게 두 가지 이유에 의해 그 자격을 할 수 있습니다 첫 번째 이유는 자연에서 온다

540,000,000년 전에, 놀라운 이벤트 동물의 진화에 일어났다 어떤 이상한 이유로, 동물 종의 수 아주 간단한 몇 종 갔다 다양성의 폭발적인 증가 동물의 종류이다 그것은 진화 또는 캄브리아기의 대폭발로 간주되었다 폭발 그리고 동물 학자는 많은 수십 년 동안 의아해했다 이런 일이 이유에 대해 그리고 최근, 매우 설득력있는 저명한 이론 그것은 눈의 시작이었다 추측

동물 비전입니다 눈이 먼저 동물에서 개발되었을 때, 갑자기 동물의 수명은 사전되었다 포식자와할까요, 전체 발전이 그냥 변경 540,000,000년 후, 인간은 가장 지능 시각적 인 동물 사실, 자연은 우리의 뇌의 절반을 헌신 때문에 중요성 시각 처리

그래서 하나의 증거 하나 개의 스레드입니다 증거의 또 다른 조각 기술과 세계에서 온다 우리는 ~에서 산다 당신은 우리의 인터넷 오늘 보면 여기서 데이터는 동안 유튜브 혼자 파묻히다 업로드 한 동영상의 300 플러스 시간을 본다 매 순간이, 그리고 80 % 이상 추정된다 전체 사이버 화소 형태의 일종이다 그리고 센서 봐 캡처 센서의 가장 큰 데이터 형식 이 있는지 여부, 이미지의 어떤 종류에 가시 광선 또는 가시광 스펙트럼의 외부

자가 운전 자동차에서 병원 생물학 실험실에서 감시 cameras–에 모든 곳에서, 픽셀 format– 픽셀 데이터 포맷은 가장 귀중한 데이터 인 소비자와 기업 클라우드에서, 나는 많은 고객에게 이야기 할 기회가 있었다 나는, 이미지 인식의 요구에 대한 모든되었습니다 영상 처리, 비디오 분석 그래서 정말 컴퓨터 비전에 대한 흥미로운 시간이다 다시, 음성 인식 단지와 유사합니다

깊은 신경망의 진행 덕분에, 비전 정말 진행을 많이 만들어졌다 필드로 이륙했다 지난 10 년 동안, 2010– 사이 또는 2017 년 일곱 years–, 나는 가장 큰 것을 말할 것입니다 컴퓨터 비전의 문제는 기본 인식이다 tasks– 물체 인식, 이미지 태그, 물체 검출 우리는 이미 제품 그건 나오는, 당신이보고,이 Google 포토,자가 운전 차량에 보행자 감지, 이 모든

그러나 투자의 다음 위상 컴퓨터 비전 기술, 내 의견으로는, 비전은 정말 플러스 X의 비전입니다 의사 소통과 언어의 가장 기본 우리는 어떻게 이야기를 말합니까? 우리는 어떻게 태그를 인덱스 동영상합니까? 비전과 언어 사이의 연결 및 상호 작용 그래서 매우 흥미로운 일이 될 것입니다 그런 비전과 생물 과학, 우린 할수 있는지 여부 생물학에서 오는 데이터 및 건강 관리의 처리량, 비전 형태의 약은 놀랍다 그리고 그것을 방사선 또는 실험실을합니다 그리고 비전을 플레이 할 수있는 큰 기회가 있다고 생각합니다

그리고 나는 또한주고 싶은 마지막 예는 로봇이다 연구원으로 말하기,이 흥분의 많은 지금 일어나고 비전과 로봇 공학의 영역이다 우리는 한 AI는 지금까지 존재하는 한 로봇을 해왔습니다 그들이 어디에하지만 로봇은 아직 없습니다 큰 정도, 그것은 때문에 원시적 인 인식의의 체계 그리고 비전이 큰 역할을 할 수 있다고 생각합니다

그러니까 기본적으로, 나는 비전이 생각 기계의 가장 중요한 요소 중 하나 지능 또한 기업의 변화에 ​​대한 기업 다이앤 그린 (Diane Greene) : 감사합니다 다양한 관점 [박수 갈채] 우리는 시간이 없어요 때문에주의해야합니다 그래서 페르, 어떻게 비전의 도움을한다 시각화 및 시각화 도움이 기계 학습? 그리고 어쩌면 당신은 그것과 수, 시간을 저장합니다 당신의 미래를 볼 곳으로 이동 당신은 시각화를 취할 수 있습니다

페르난다 비에 가스 : 물론 그래서 그래, 그래서 여기 페이 페이의 대답에 피기 백, 우리는이 놀라 울 정도로 정교한 비전 시스템을 가지고있다 우리는뿐만 아니라 무엇 이러한 시스템을 이해하는 데 사용할 수 있습니다 하고있는 거지? 그래서 기계 학습 통계의 데이터 톤의 톤에서 실행 확률 음, 데이터 시각화 종류의 수 있습니다 밝혀 무슨 일이 일어나고 있는지 이해하려고 노력의 비밀 무기가 될 그리고 우리는 왜 상관이야? 왜 우리가 관심을 가져야? 때문에 우리는 다른 이유의 무리 관심을 가져야

하나는 해석 가능성이다 당신은 당신의 모델이 나오는 무슨 해석 할 수 있습니까? 둘째 debugability입니다 더 나은 당신의 모델에 무슨 일이 일어나고 있는지 이해 당신이 다음을 디버깅 할 수 있습니다 그리고 마지막으로, 또한 교육이있다 시각화는 이미 중요한 역할을하고있다 그것은 기계 학습에 대한 교육에 관해서

그리고 나는 또한 최종 교육 조각이 나는 매우 흥분이 있어요 있음 우리가 더 잘 이해하기 시작하면 이는,이다 우리는 이해하기 위해 시각화를 사용하는 경우 시스템이 무엇을하고 있는지 더 나은, 우리는 그들로부터 다음을 배울 수 있는가? 우리는 더 나은 전문가, 좋은 도메인이 될 수 있습니다 어떤 전문가 나는 의사예요 경우 내가 건축가 해요 경우, 그것은 무엇이든 어떻게이 매우 특정 시스템에서 배울 수 다음 전문으로 더 나은? 내가 생각하는 시각화에 대한 또 다른 것은 정말 강력하고 정말 중요하다 에 의해 시각화를 사용한다는 사실은 추적하기 위해, 우리는 항상 오른쪽 루프에서 인간을 지키는거야? 그리고 그 거대하다 그리고 우리는 자율적 인 시스템을 구축으로, 우리는 그들이 잘 행동하고 있는지 확인하고 싶습니다 그리고 시각화가 도움이 될 수 있습니다 나는 당신에게 대해 매우 빠른 일화를 이야기 할 moment– 과학 순간 시각화 우리를 보였다 때 대한 기계 학습하기 전에 우리가 모르는 뭔가 체계

그래서 작년에, 구글은 다국어 번역 배치 시스템 및 좋았어요 그것은이 정말 흥미 진진한 순간이었다 단지 다른 언어의 톤을 넣어 하나의 시스템에서 시스템을 가지고 어떻게 든 방법을 알아낼 언어의 모든 쌍에서 번역합니다 여분의 보너스는 할 수 있었다이었다 그것이 어디에서 무슨 일이 제로 샷 번역라고 언어 쌍에서 번역 할 수 반드시 한 번도 본 적이 없습니다 기본 연구 중 하나 그래서 문제는 이러한 시스템을하는 전문가가 있다고했다, 어떻게 시스템은 다국어 데이터의이 공간을 해결한다? 이 시스템은 뭔가를 만드는 것을 , 종류의 영어 여기에 모델처럼 보인다 및 스페인어 여기 모델, 포르투갈어 또 다른 하나? 또는 시스템은 매우 다른 일을하고 있습니까? 어디 종류의 모든 것을 혼합 같은 공간에, 그것은 어쩌면이다 의미에 대해 뭔가를 배우고 단어의 의미와 반드시 어떤 언어가에서 오는 또는 어떤 언어 난 로 번역? 그래서 우리가 무슨 짓을했는지, 우리는 시각화를 구축 이 조사합니다 그리고 정말 흥미로운 점이었다 우리는 우리가 문장을 시각화 that–보기 시작 때 다른 쌍의 무리로 번역되고 있었다 언어의

그리고 정말 흥미로운 일이었다 우리는 문장의 클러스터를보고 서로 다른 언어로 함께 표시됩니다 그래서 나는 포르투갈어에서 번역하고있어 문장이있는 경우 영어와 그 반대로 스페인어, 그 표현의 모든 클러스터 함께 나타났다 그리고 모든 클러스터와 여기에 다음 다른 문장 모든 언어와의 then– 그래서 다른 말로하면, 우리는 무엇을 발견 했는가? 우리는 시스템이 공간을 분할되지 않았 음을 발견 다른 언어로 이 시스템은 고유의 표현과 함께오고 그 여러 언어의 그래서 다른 말로하면, 우리는 첫 번째 징후를 보았다 뭔가의 보편적 인 언어의 우리는 국제어를 호출 할 것이다

그것은 놀라운이었다 우리가 가진 것처럼 그리고 그것은 거의이었다 , MRI를 통해 다국어 시스템을 실행 우리는 같은 워입니다! 다음은이는 – 결과입니다 다른 것은 시각화는 우리가 할 수 다음 지역을보고했다 그것은 아주 잘 resolved– 보이지 않았다 여기서 약간의 언어 종류의 자체 놀고 있었다

사람들은 좋지 않았다 번역했다 그들은 높은 품질을하지 않았다 그래서 그것은 우리에게 알려줍니다 것은 이들 공간의 기하학 의미가있다 그리고 당신은 당신의 이웃 정렬이있는 경우 그 자체로 주변에서 놀고, 당신은보고 할 수 있습니다 당신은 당신의 시스템을 디버깅 있는지 확인 할 수 있습니다

그래서 이러한 종류의 강대국 당신은 이해하고 더 나은 일을 할 수 있습니다, 만드는 일이 더 잘 작동합니다 그리고 미래의 것들 중 하나에 대한 종류의 손에 손을 이동에 대해 정말 흥분 페이 페이 난에 대한 진정한 옹호자라고 생각 뭔가, AI 민주화있다 시각화, 나는 think– 및 기타 techniques– 그것은뿐만 아니라 시각화,하지만 진정 I 믿는 사람들이 더 많은 다른 종류의 우리는 오프 더 나은 우리가있어, ML의 배에 가져 될 것 지금, AI는 여전히 매우 엔지니어링 중심의 느낌 그리고 나는 우리가 가져올 때 무슨 일이 일어날 지 정말 궁금하다 디자이너, UXers, [에? 과학자?] [? 라고?] 우리는 유치하기 시작하고 있습니다 다른 가능성은 무엇입니까? 우리는 심지어 생각하지 않은 다른 솔루션은 무엇입니까 그것에 대해 우리는 탐험을 시작할 수 있습니다? 다이앤 그린 (Diane Greene) : 감사합니다

[박수 갈채] 내가 당신을 요청해야처럼 프랑소와는 느낌 어떻게 데이터 시각화 음성 인식을 도울 것, 그러나 나는 또한 데이터가 더수록에 대해 물어보고 싶은게 단지, 당신도 알다시피, 우리는이 모든 표시된 데이터를 했어 및 훈련 모델 우리가 더 많은 개인화을, 여기서이 기술은가는 무슨 문제 있어요 당신은 흥분입니까? 프랑소와 BEAUFAYS : 네, 사실은 매우 흥미 롭습니다 우리는 음성 인식에 새로운 문제에 뛰어들 때마다, 우리는 정말 감각에 집중해야 당신은 우리가 유튜브 키즈 작업을 시작할 때, 알고, 예를 들어, 이는, 아이들을 위해 유튜브 공간이었다 우리는 정말 그 젊은 목소리에 집중했다 그들은 우리가 같은 방법을 말하지 않는다 그들은 같은 피치 범위가없는, 그들은 말을 자르고 같은 방법이 없습니다 그들은이 심호흡을 한 다음 그들이 연설의 버스트있다 그래서 우리는 정말에 집중했다

그리고 결국, 우리는 방법을 발견 다시 접는의 우리의 일반적인 모델로 학습하는 것이 구글 홈 그래서, 예를 들어, 그것은 당신과 함께 수행뿐만 아니라 자녀와 함께 작동합니다 그러나 구글 홈 자체가 어디에서 새로운 환경도했다 우리는 새로운 데이터를 수집했다 그리고 데이터가 사용 가능한 경우, 다음은 모델로 접어 및 재교육을 유지하기 쉽다 그러나 처음으로 당신이 Google 홈 장치를 실행하려면, 당신은 바로 그것을 가지고 있지 않은거야? 그래서 우리는 시뮬레이션을 많이 했어요 데이터를 가지고 다른 유형의 잡음을 추가 데이터에 잔향의 종류를하는, 실제로, 우리는 방대한 양의 데이터를 사용합니다 우리는 수십 연설 시간의 수천을 쓰다 그리고 우리는 시뮬레이션과를 곱합니다

뭔가 당신이 수학을 할 경우, 평균 언론의 세기의 소수처럼 그게 우리가 모델로, 그래서 그냥 대량 접을 수 있습니다 그리고 나는 그것이 매우 흥미로운 것 같아요 즉 더 많은 문제를 확장하는 방법에 대해 생각하는 다른 음향 특성, 뿐만 아니라 다른 언어로 내가 너희들을 요청할 수 있습니다 경우에 당신은 당신의 얼마나 많은 알고처럼 영어가 아닌 다른 언어를 사용? 오른쪽, 당신은 볼? 모든 손이 제기된다 그래서 우리는 정말 모든 우리의 기술을 사용할 수있게하려면 자신의 언어로 당신의 당신이 생각한다면, 그것은 엄청난 문제입니다

우리는 어떻게 그렇게 할거야? 우리는 하나 개 인식기를 구축려고하고있다 여러분 모두를 위해 작동? 우리는 우리가 지금처럼, 언어 당 하나를 수행하는 건가요? 그럼, 어떻게 방언에 대해, 다음? 그리고 우리는 어떻게 할 건데 때 작은 포켓 상당히 작은 하나의 언어를 가지고 개인의? 당신은 언어 학자를 요청한다면, 그들은 당신을 말할 것이다 세계에서 6,000, 7,000 언어가 있음 그들은 them– 약 1,000의가 있음을 알려드립니다 실제로, 1342, 그들은이 그 말 10 만 명 이상 스피커 그래서 많은 맞죠? 그리고 우리는 정말 깊은 국제화로 이동하려는 경우 그리고, 지구에 큰 인구를 가진 모든 언어를 제공 창의성을 많이 요구하는 것 기계 학습 측에서 데이터를 공유 할 수 관리하기 언어 사이에, 다른 언어에서 배우고, 그래서 지금의 나는 정말 흥분 생각 해당 도메인에 할 일의 톤은 여전히 ​​존재한다 다이앤 그린 (Diane Greene) : 나는 동의한다 그것은 매우 흥미로운입니다

고맙습니다 [박수 갈채] 우리는 조금 이상 갈, 그래서있어 우리 페이 페이와 다프네의 미래에 대해 듣는 시간을 가지고있다 페이 페이, 앞으로 무엇이 가능한지에 대해 무엇을 흥분? 페이 페이 리 : 무엇에 대해 저를 흥분 무엇 가능한 한 앞으로? 나에게 한 차원을 가정 해 봅시다 나는 일반적으로 AI가 주행 중 하나입니다 생각 네 번째 산업 혁명의 힘 그것은 시작에 불과하지만 가능성이있다 인간의 생활 방식을 변환하는 작업과 통신합니다

그리고 하나 좋아하는 줄은 나는 철학자 소식 독립적 인 기계 값이 없다입니다 기계 값은 인간의 값입니다 그래서 한 가지 정말 날 흥분하는 다양한 기술자를 포함하는 것입니다 AI의 분야에서 함께 미래를 건설합니다 때문에 우리는 표현의 다양성을 일단 AI 기술 분야에서, 우리 전체 인류를위한 기술을 구축 할 것입니다, 그것의 단지 한 조각 다이앤 그린 (Diane Greene) : 예, 당신은 신뢰성을 많이 가지고 당신은 그 페이 페이를 말할 때

[박수 갈채] 그리고 다프네, 생물학의 교차점, 컴퓨팅, 그리고 다른 모든 것들 당신은 뭐 했어 다프네 콜러 : 글쎄, 내가 진행 상황을 볼 때 그 기계 학습은 지난 5 ~ 10 년 동안했다 오랫동안 인공 지능 연구원으로, 당신이 원하는 경우 심지어 5 년 전 나에게 물었다, 컴퓨터 것이다 어떤 종류없이 이미지를 자막을 할 수 사전 지식, 그냥 같은 품질 인간은, 내가 말한 것이다 것, nehh, 어쩌면 이십년있다 그리고 페이 페이와 다른 사람의 작품에, 우리는 더 빨리 그 이정표 방법에 도달 할 수있었습니다 보다 내가 기대했을 것이다

나는 코 세라에서 생물학으로 다시 이동하는 이유 나는 우리가 무릎을 치고 있다고 생각하기 때문이다 생물학의 곡선이다 그래서 당신이 볼 때, 예를 들어,에 일부 현재 예측 거기 "큰 Data–라는 2015 년에 출판 된 논문이었다 천문 또는 Genomical? " 그리고 그것은 인간 게놈 시퀀스의 수에 보이는 의 생물학적 데이터의 매우 제한된 부분은 촬영되고, 당신은 과거 추세를 보면, 그 금액은 매 7을 두 배로 달, 어떤 배 빠른 무어의 법칙으로 대해를합니다 그래서 당신은 2025을보고 당신이 그 선을 투사 할 경우, 2025 년 인간 게놈 서열의 개수 보수적 투사에있을 것입니다, 1 억, 당신이 과거 추세를 보면, 그것은 억 수 있습니다 두 억 인간 게놈 시퀀스, 그것은 단지 순서입니다 즉 RNA, 및 프로테옴 및 몸 전체를 계산하지 않습니다 이미징 및 세포 이미징

그래서 우리는 시작의 첨단에있어, 정말 가장 복잡한 시스템이 무엇인지 이해의 생각 우리가 발견 한 것으로, 생물학적 시스템의은이다 그것은 우리가 살아 만드는 무엇입니까? 그것은 죽을 우리를 강제로 그 무엇입니까? 그래서 나는 데이터와 기술의 양의 생각 그 기계 학습 개발하고 계속 개발하기 위해, 우리는 기회를 가질 수 정말이 방법으로 과학을 변환합니다 그리고 나는 그 두 가지를 가져다 줄 수있을 정말 흥분 지역 사회가 함께하는 가능하게한다 [박수 갈채] 다이앤 그린 (Diane Greene) : 그래서 분명히 훨씬 더있다 우리는 앉아서 여기를들을 수있다 이건 그냥 급격하고있다 재미 있고 감동적인 패널

대단히 감사합니다 페이 페이 리는 : 다이앤 감사합니다 [박수 갈채]