Advanced audience targeting with data and AI

[음악] 안녕하세요 오늘 하루는 어떻게됩니까? 그래서 영화 산업은 재능있는 예술가와 함께 일할 수있는 능력 스튜디오가 가져올 수있는 능력 관중들, 오늘 내가 무엇을하고 있는지 내가 너에게 말할거야

우리가 한 일의 일부 Google Cloud는 이야기와 결혼하고 우리가 잠시 보았던 관중들 이제는 비용이 많이 들고 고객을 유치하고 재능을 끌어 들이기 우리가 왼쪽 아래에서 오른쪽 위 사분면 그리고이 움직임은 긴장감을 키우고 있습니다 한편 지각 판 사이 예전에 내장 된 관성력 다른 일을하는 방법 내가 부를 수있는 것들 능력이란 무엇인가 발견 Hardy 's 발견은 중요한 정보를 제공합니다 특히 임원 및 영화 제작자에게 비판적인 영화는 비판적이다 속편이 이제 잠재 고객 발견 과정과 밀접한 관련이있다 영화를 만들 때의 스토리 텔링 스튜디오 경영진의 제작자 왜 알지? 영화는 새로운 무엇이 될 필요가있다

영화와이 영화는 누구인가? 이 질문을하기 위해 만들어진 것은 어렵다 정확하게 대답하려면 여기에 열쇠가 있습니다 관객에 대한 이야기 ​​내부에는 돌을 맞춰서 이야기와 관객은 단지 그것을 프로세스의 결과로 발생시킨다 스튜디오와 영화 제작자들은 실제로 그들이 조정할 수없는 많은 손잡이 이 정렬을 달성하기 위해 그것은 복합체이다 문제이며 이점은 문제입니다

데이터 중심의 통찰력 때문입니다 스튜디오가 데이터 수집 중입니다 오늘 도구를 만들고 건축하기 때문에 두 가지 도구에 대해 알려줍니다 우리는 폭스에서 처음으로 만들었습니다 마릴린과 마릴린이 대답했다

어떤 영화 유형에 관한 질문입니까? 마릴린이 뭉치를 만들려고 노력하고있어 의 데이터를 보면 보이는 컴퓨터 비전을 통한 영화 음모에 영화를 통해 NLP를 생성 한 다음 가능성이있는 DNA를 기술하는 보고서 두 번째 데이터를 기반으로 한 영화 우리가 만든 툴은 밤이라고합니다 크롤러는 기본적으로 이 질문은 우리가 만들려고 노력하고 있었고 도구가 거대한 병렬 질문을한다 수백 가지의 멀티 샘플링 샘플링 다른 관객과 그것을 출력합니다 우리를 도와주는 정교한 보고서 전례없는 수준으로 묘사하다 이 핵심 팬이 누구인지 자세히 설득력있는 영화 관객 및 노 쇼가 누구인지 이제 저는 여러분에게 이야기 할 것입니다

최고의 쇼맨은 이것이 우리가 실제로 데이터를 일부 용지에 적용했습니다 이 영화는 영화와 유사한 잠재 고객 또 다른 뮤지컬이었던 라 – 라 – 땅 작년에 열린 우리 사교적 인 온라인 채팅 속도 실제로 미디어는 젊은 여성 데모의 방향 가설과 일치했다 라 라 랜드 놀람은 우리가 사용하기 시작했을 때왔다 우리가 예고편을 분석 할 때 사용한 도구 그렇지 않은 더 넓은 잠재 고객을 발견하십시오 반드시 젊은 데모 센터에서 가족 영화를 중심으로 디즈니 뮤지컬과 기분 좋은 이 권한 부여 드라마는 매우 그것은 변화를 제안했기 때문에 중요하다

우리의 마케팅 전략은 우리는 결국에 큰 영향을 미친다고 생각합니다 영화의 성공은 너무나도 다행 스럽다 우리에게 영화는 꽤 잘했다 4 억 달러의 북쪽 전 세계적으로 Studios는 그들이 경쟁하기 위해 배우고 있다는 것을 배우십시오 세계의 이야기와 관객 불완전하지만 다차원 데이터 그리고 그들은 또한 그 자리에 정렬을 측정하는 프로세스 이야기와 청중 사이 신속한 재 할당을위한 열쇠가 될 마침내 그들은 건물을 짓고있다

인공 지능 도구를 사용하지 않는 건물 속일 수밖에 없지만 재능있는 밝은 영화 제작자와 더 관련성 있고 긴급한 영화 제작 경험은 대단히 감사합니다 [박수 갈채] [음악]

KAIST and SNU nominated as Google AI Focused Research Awards Program researchers

서울 대학교와 KAIST는 한국 AI 대학에 처음으로 입학하였습니다 집중 연구 상 프로그램

내년에이 두 기관의 참가자들은 기술과 협력 할 것입니다 자이언트의 연구원 및 엔지니어링 팀이 클라우드 기술, 연설 인식, 그리고 깊은 학습 임기가 끝나면 Google은 연구 프로젝트를 계속할 것인지 여부를 평가합니다

Bringing AI and machine learning innovations to healthcare (Google I/O ’18)

[음악 재생] 릴리 펭 : 안녕 모두들 내 이름은 릴리 펭이야

나는 의사로서 훈련을하고 있으며 나는 Google 의학에 종사하고있다 잘, Google 인공 지능 건강 관리 팀 저는 제품 매니저입니다 그리고 오늘 우리는 몇 가지 프로젝트에 대해 이야기 할 것입니다 우리 그룹에서 우리가 해왔 던 그래서 처음에는, 당신이 많은 것을 얻을 것이라고 생각합니다

그래서 나는 이것을 너무 많이 지나치지 않을 것입니다 그러나 우리는 깊은 학습을 적용하기 때문에 의료 정보에, 나는 원하는 종류의 조금만 사용되는 몇 가지 용어를 정의하는 것 그러나 다소 불충분하게 정의됩니다 그래서 처음으로, 인공 지능 – 이것은 꽤 광범위한 용어이며 그 거대한 프로젝트를 포함합니다 비인간적 인 지능을 구축한다 기계 학습은 특별한 유형입니다 인공 지능에 대해서, 그것은 더 똑똑해질 수있는 기계를 가르치고 있습니다

그리고 깊은 학습은 특별한 유형입니다 너희들 기계 학습의 아마 꽤 많이 들었고 꽤 많이 들었습니다 우선 무엇보다 깊은 학습이란 무엇입니까? 그래서 인공 신경 네트워크의 현대 환생입니다 실제로 1960 년대에 발명되었습니다 그것은 조직 된 단순한 훈련 가능한 단위의 모음입니다 레이어에서

그리고 그들은 함께 작업하여 복잡한 작업을 해결하거나 모델링합니다 따라서 일반적으로 데이터 세트가 작고 계산이 제한적일 경우, 우리가 1980 년대와 90 년대에 가진 것입니다 일반적으로 다른 접근 방식이 효과적입니다 그러나 더 큰 데이터 세트 및 더 큰 모델 크기 더 많은 컴퓨팅 성능을 제공한다면, 우리는 신경 네트워크 훨씬 더 잘 작동합니다 실제로 두 가지 테이크 아웃이 있습니다

너희들이이 슬라이드에서 나가길 바란다 하나는 깊은 학습 열차 알고리즘입니다 충분한 데이터가 주어지면 매우 정확합니다 두 가지, 깊은 학습이 이것을 할 수 있습니다 기능 공학없이 그리고 그것은 명시 적으로 규칙을 쓰지 않고 의미합니다 그럼 그게 무슨 뜻이야? 글쎄, 전통적인 컴퓨터 비전에서, 우리는 규칙을 쓰는 데 많은 시간을 할애한다

특정 예측 작업을 수행하기 위해 기계가 따라야한다는 것을 의미합니다 길쌈 신경 네트워크 (convolutional neural networks) 우리는 실제로 기능에 거의 시간을 소비하지 않습니다 이러한 규칙을 작성하고 작성합니다 우리가 데이터 준비에 소비하는 대부분의 시간 수치 최적화 및 모델 아키텍처 그래서 나는이 질문을 꽤 많이 받는다

그리고 문제는 얼마나 많은 데이터가 충분한 데이터인지입니다 깊은 신경 네트워크? 일반적으로 더 많은 것이 좋습니다 그러나 특정 시점을 넘어선 수익이 감소하고 있습니다 일반적인 경험 법칙은 클래스 당 약 5,000 개의 긍정적 인 것을 좋아합니다 그러나 중요한 것은 좋은 관련 데이터입니다

쓰레기통에, 쓰레기통 이 모델은 예측하기 위해 무엇을 요구 하는지를 매우 잘 예측합니다 그래서 당신이 기계 학습을 어디에서 생각하는지, 특히 깊은 학습은 가장 큰 영향을 미칠 수 있습니다 실제로 장소에 있습니다 살펴볼 많은 데이터

우리 이사 중 한 명인 Greg Corrado가 최선을 다합니다 깊은 학습은 당신이 해낸 일에 정말 좋습니다 시간, 그리고 10,001 번째 시간에, 당신은 단지 그것의 아플 뿐이에요 더 이상하고 싶지 않아 그래서 이것은 검진에서 건강 관리에 정말 좋습니다

많은 환자를 볼 수있는 응용 프로그램 잠재적으로 정상입니다 전문 기술이 제한되어있는 곳에서도 좋습니다 오른쪽에 그래프가 나타납니다 세계 각국의 방사선과 의사 부족의 부족 그리고 이것은 다른 의학 전문 분야에도 해당됩니다

그러나 방사선과 의사가 여기 있습니다 그리고 우리는 근본적으로 의료 전문 지식의 세계적 부족을 봅니다 그래서 심사 신청 중 하나 우리 그룹이 당뇨병 성 망막증을 앓고 있습니다 더 쉽기 때문에 우리는 이것을 DR이라 부릅니다 당뇨병 성 망막증보다

그리고 예방 가능한 실명의 가장 빠른 성장 원인입니다 당뇨병 환자는 모두 4 억 5 천만 명에 달합니다 1 년에 한 번 상영됩니다 이것은 뒤의 사진을 찍음으로써 이루어진다 특별한 카메라로 눈의 모습을 볼 수 있습니다

그리고 그림은 그 것처럼 조금 생겼습니다 의사가 이런 이미지를 얻을 때 의사가하는 일 질병없이 1에서 5 단계로 등급을 매기 는가, 건강하고, 질병을 번식시키고, 그것은 마지막 단계입니다 그리고 그들이 등급을 매길 때, 때로는 매우 미묘하게 보입니다 결과, 미세 동맥류라고하는 작은 것들 그것은 눈의 혈관에 outpouchings입니다 그리고 그것은 당뇨병이 얼마나 안 좋은지를 나타냅니다

당신의 비전에 영향을 미치고 있습니다 그래서 불행히도 세계의 많은 지역에서, 이 일을하기에 안과 의사가 충분하지 않습니다 그래서 인도에있는 한 파트너와 함께, 또는 실제로 인도에있는 우리의 파트너 몇, 전국에 127,000 명의 안과 의사가 부족합니다 결과적으로 환자의 약 45 % 질병이 감지되기 ​​전에 시력 손실의 일종을 겪는다 네가 회상 한대로이 질병이 완전히 예방할 수있었습니다

다시 한번 이것은 일어나서는 안되는 것입니다 그래서 우리가하기로 결심 한 것은 우리가 파트너가 된 것입니다 인도에 몇 군데 병원을두고, 미국의 선별 서비스 제공 업체입니다 그리고 우리는이 첫 번째 시도에 대해 약 130,000 개의 이미지를 얻었습니다 우리는 54 명의 안과 의사를 고용하고 라벨링 도구를 만들었습니다

그리고 54 명의 안과 전문의는 실제로 이 스케일에서이 이미지의 등급을 매겼는데, DR에서 증식으로 흥미로운 점은 실제로 의사가 이미지를 호출하는 방법에 약간의 변동성이 있습니다 그래서 우리는 실제로 약 880,000 건의 진단을 받았습니다 이 레이블이 지정된 데이터 세트를 사용하여 알려진 콘볼 루션 신경망 이것은 시작이라고합니다

나는 너희들 중 많은 사람들이 그것에 익숙하다고 생각한다 일반적으로 사진 앱을 위해 고양이와 개를 분류하는 데 사용됩니다 또는 다른 검색 애플 리케이션을 위해 그리고 우리는 그저 안저 영상을 재사용했습니다 그래서 우리가 배운 다른 것 우리가이 일을하는 동안 그게 정말 유용했던 동안 이 5 점 진단, 그것은 또한 믿을 수 없을만큼 의사에게 유용하다

이미지 품질과 같은 하우스 키핑 예측에 대한 피드백, 이것이 왼쪽 눈인지 오른쪽 눈인지, 또는 이것이 망막의 어느 부분인지 알 수 있습니다 그래서 우리는 그것을 네트워크에도 추가했습니다 그럼 얼마나 잘하는거야? 이것이 우리 모델의 첫 번째 버전입니다 우리가 2016 년 의학 저널에 발표 한 내용은 제가 믿습니다 여기 왼쪽에는 차트가 있습니다

총계에있는 모형의 성과의 약 10,000 개 이상의 이미지 민감도는 y 축에 있고, 1 마이너스 특이성 x 축에있다 감도는 시간의 백분율입니다 환자가 질병에 걸렸다면 그 모델이 그 질병을 부르고 있었을 때, 맞았습니다 그리고 특이성은 비율입니다

모델에 질병이없는 환자들 또는 의사가 옳았다 그리고 당신은 뭔가를 원한다는 것을 알 수 있습니다 높은 민감도와 높은 특이성을 지니고 있습니다 그리고 위아래로 – 또는 위로 그리고 왼쪽으로 좋다 그리고 차트에서 여기를 볼 수 있습니다

작은 점들이 그 의사들이라고 동일한 세트를 채점하고있었습니다 그래서 우리는 의사와 매우 가까워졌습니다 그리고 이들은 보드 인증을받은 미국의 의사들입니다 그리고 이들은 안과 의사, 일반 안과 의사들입니다 훈련으로

사실 F 점수를 보면 감도와 특이성의 결합 된 척도이며, 우리는 중앙 안과 전문의보다 조금 나아졌습니다 이 특별한 연구에서 그래서 그 이후로 우리는 모델을 향상 시켰습니다 그래서 작년에 약 2016 년 12 월 우리는 일종의 동위에 있었다 일반인들과

그리고 올해는 – 이것은 우리가 발행 한 새로운 논문입니다 우리는 실제로 망막 전문가를 사용했습니다 이미지를 채점하기 위해 그래서 그들은 전문가입니다 우리는 또한 그들이 동의하지 않을 때 논쟁하도록했습니다

진단이 뭔지에 대해서 그리고 우리는 모델을 언제 사용 하는지를 볼 수 있습니다 그 사실을 근거로 모델은 매우 잘 예측했습니다 게다가 올해 우리는 일종의 동위에 있습니다

망막 전문가와 그리고이 가중 카파는 단지 5 수준의 합의 그리고 본질적으로 우리는 안과 의사와 망막 사이의 일종 사실 전문가들 사이에 망막 전문가 우리가 작업 해 왔던 또 다른 일 모델을 개선하는 것을 넘어서 실제로는 네트워크를 설명하려고 애쓰다 그것이 어떻게 예측을하고 있는지 다시 한번, 연극이나 연극을 가져 가라

소비자 세계의 플레이 북에서, 우리는 show me where라는 기술을 사용하기 시작했습니다 그리고 이것은 이미지를 사용하는 곳입니다 실제로 열 화상지도를 생성합니다 관련 픽셀은이 특정 예측을위한 것입니다 그래서 여기 포메라니스트의 그림을 볼 수 있습니다

그리고 히트 맵은 거기에 당신을 보여줍니다 포메 라니아 사람의 얼굴에있는 무언가이다 그것은 Pomeranian-y를 보게합니다 그리고 여기 오른쪽에는 아프간 인의 사냥개가 있습니다 그리고 네트워크는 아프간 인 사냥개를 강조했다

그래서 이와 비슷한 기술을 사용하여, 우리는이를 안저 이미지에 적용했다 우리가 말했지, 어디 있는지 보여줘 이것은 가벼운 질병의 경우입니다 그리고 나는 가벼운 질병이라고 말할 수 있습니다 왜냐하면 – 잘, 그것은 나에게 완전하게 정상적으로 보인다

나는 거기에 어떤 질병이 있다고 말할 수 없다 하지만 고도로 숙련 된 의사라면 미세 동맥류 라 불리는 작은 것을 골라 낼 수있다 녹색 지점이있는 곳 다음은 중등도의 질병 사진입니다 그리고 이것은 당신이 볼 수 있기 때문에 조금 더 나쁩니다

여기 끝에 약간의 출혈 그리고 실제로 나는 신호 할 수 있는지, 하지만 거기에 피가 나옵니다 그리고 열지도 – 히트 맵이 있습니다 출혈을 일으킨다는 것을 알 수 있습니다 그러나이 이미지에는 두 가지 유물이 있습니다

그래서 작은 얼룩처럼 먼지가 있습니다 그리고이 작은 반사가 있습니다 이미지의 중간에 그리고 당신은 그 모델이 근본적으로 그것을 무시합니다 그럼 다음은 뭐니? 우리는 모델을 훈련 시켰습니다

우리는 다소 설명 할 수 있음을 보여주었습니다 우리는 그것이 올바른 일을한다고 생각합니다 무엇 향후 계획? 음, 우리는 실제로 의료 시스템에 이것을 배치해야합니다 우리는 의료 공급자와 제휴하고 있습니다 그리고 회사는이를 환자에게 제공해야합니다

실제로 제게 메가 박사님, 누가 저를 대담하게 말할 것입니까? 이 노력에 대해 좀 더 자세히 설명 할 것입니다 그곳에 그래서 심사 신청서를 제출했습니다 그리고 여기 진단의 응용이 있습니다 우리가 작업하고있는 그래서이 특별한 예에서 우리는 질병에 대해 이야기하고 있습니다

우리는 유방암에 대해 이야기하고 있습니다 그러나 우리는 유방암의 전이에 대해 이야기하고 있습니다 근처 림프절로 따라서 환자가 유방암 진단을 받았을 때 원발성 유방암이 제거되면, 외과의 사는 밖으로 약간 시간을 보낸다 우리가 림프절이라고 부르는 것을 조사 할 수 있도록 유방암이 전이되었는지 아닌지보기 그 노드들에게 그리고 그것은 환자를 어떻게 대하는가에 영향을 미칩니다

이 림프절을 읽는 것은 쉬운 일이 아닙니다 그리고 실제로 그들이 돌아올 때의 생체 검사의 약 24 % 그들을보기 위해, 24 %는 마디 상태의 변화를 가지고 있었다 이는 긍정적 인 경우 부정적인 것으로 읽음을 의미합니다 그리고 그것은 음성적이었고, 긍정적이었습니다 그래서 그것은 정말로 큰 문제입니다

4 분의 1에요 흥미로운 점은 다른 연구 결과에 따르면 무한한 시간을 가진 병리학 자, 실제로 데이터에 압도 당하지 않았다 매우 민감하기 때문에 94 %의 감수성 종양 환자에게 시간 제약을 가하면, 그들의 감수성 – 또는 미안, 공급자에, 병리학 자에게는 감도가 떨어집니다 그리고 사람들은 내려다보기 시작할 것입니다

거의 전이가 없을 수도 있습니다 그래서이 그림에 바로 거기에 작은 전이가 있습니다 그리고 그것은 보통 놓친이 작은 것들입니다 많은 정보가 주어지면 놀랍지도 않습니다 각 슬라이드에 있습니다

따라서 이러한 슬라이드 중 하나가 디지털화 된 경우, 약 10 기가 픽셀입니다 그리고 그것은 말 그대로 건초 더미에있는 바늘입니다 흥미로운 점은 병리학 자들이 실제로 그들이 자신의 모든 시간을 보면서 암의 73 %를 찾는다 슬라이드마다 오진 (false positive)이 발생합니다 그래서 우리는이 작업을 도울 수있는 모델을 교육했습니다

실제로 암 병변의 약 95 %를 찾습니다 슬라이드 당 8 개의 가양 성이 있습니다 그래서 이상적인 시스템은 분명히 하나입니다 모델을 사용하여 매우 민감하지만 매우 구체적입니다 병리학자를 실제로 훑어 보는 것에 의존하는 거짓 긍정 (false positive)과 오탐 (false positive)이라고합니다 그래서 이것은 매우 유망하며 우리는 지금 클리닉에서 유효성 검사를하고 있습니다

독자 연구의 관점에서, 이것이 실제로 어떻게 의사와 상호 작용하는 것은 정말로 중요합니다 그리고 분명히 다른 조직에 응용할 수 있습니다 나는 림프절에 관해 이야기했지만 초기 연구가있었습니다 실제로 이것은 전립선 암에서 효과가 있음을 보여줍니다 글리슨 그레이딩에 대해서도 마찬가지입니다 그래서 이전 예제에서 우리는 말했습니다

얼마나 깊이있는 학습이 매우 정확합니다 그리고 그들은 의사가 이미 만들었던 전화를하는 경향이 있습니다 그러나 의사가 현재하지 않는 것들을 예측하는 것은 어떨까요? 이미징에서 할거야? 그래서 당신이 이야기의 처음부터 기억하고 있듯이, 깊은 학습에 대한 위대한 것들 중 하나 매우 정확한 알고리즘을 훈련시킬 수 있다는 것입니다 명시 적으로 규칙을 작성하지 않아도됩니다 그래서 우리는 완전히 새로운 발견을 할 수 있습니다

그래서 왼쪽 그림은 종이에서 나온 그림입니다 우리가 최근에 출판 한 다양성을 예측하는 훈련 된 심층 학습 모델 의 심혈관 위험 요인 여기에는 나이, 자기보고 섹스, 흡연 상태, 혈압, 일반적으로 의사들 환자의 심장 혈관 위험을 평가하기 위해 지금 고려해보십시오 적절한 치료 권고를하십시오 그래서 우리는 우리가 이러한 요소 중 많은 것을 예측하고, 매우 정확하게, 실제로 5 년 위험을 직접 예측할 수 있습니다

심장 사건의 그래서이 연구는 아주 일찍, 정말 폐활 적이었고, 이 예측을위한 AUC는 07이다 이 숫자가 의미하는 것은 두 장의 그림이 주어지면 심혈관 사건이없는 환자의 사진 그리고 한 환자의 사진은 약 70 % 그 시간의 대부분의 의사들은 약 50 %의 시간을 보냈고, 그것은 무작위 적이기 때문에 – 마치 혼자 망막 이미지를 기반으로하기가 어렵습니다 그렇다면 왜 이것이 흥미로운가? 일반적으로 의사가 시도 할 때 심혈관 질환 위험을 평가하기 위해, 관련된 바늘이 있습니다

그래서 나는 누군가가 혈중 콜레스테롤을 섭취했는지 모른다 상영 전에 밤에 금식하고 혈액 샘플을 가져가 그런 다음 위험을 평가합니다 다시 한번, 저는 이것이 정말로 초기에 있다는 것을 강조하고 싶습니다

그러나 이러한 결과는 아이디어를 뒷받침합니다 우리가 뭔가를 사용할 수 있을지도 몰라 우리가 할 수 없었던 새로운 예측을하기 위해 이미지처럼 전에 만들어라 그리고 이것은 정렬로 수행 될 수 있습니다 비 침습적 인 방식으로

그래서 몇 가지 예를 들어 보았습니다 세 가지 예가 있습니다 얼마나 깊은 학습이 실제로 두 가지 가용성을 증가시킬 수 있는지 건강 관리의 정확성 그리고 내가 원하는 종류의 것들 중 하나 이것이 여기에있는 이유가 여기에 있음을 인정하십시오 TensorFlow는 점점 더 흥미 진진합니다

오픈 소스입니다 일반적인 기계 학습에서 이런 종류의 개방형 표준 어디서나 적용되고 있습니다 그래서 저는 Google에서 한 일의 예를 들었습니다 커뮤니티 전체에서 수행되는 많은 작업이 있습니다 매우 유사한 다른 의료 센터에서

그래서 우리는 무엇에 대해 정말 흥분하고 있습니다 이 기술은 건강 관리 분야에 도움이 될 수 있습니다 그리고 그걸로 Jess Mega를 소개하고 싶습니다 저와 달리, 그녀는 진짜 의사입니다 그리고 그녀는 Verily의 최고 의료 책임자입니다

제시카 메가 : 여기에와 주셔서 감사합니다 그리고 우리를 걷어차 기 위해 릴리에게 감사드립니다 나는 AI와 건강 관리에 대한 흥분을 생각한다 더 커질 수는 없다 들으 셨던 것처럼, 제 이름은 메스 제스입니다

나는 심장 전문의이고, 너무 기쁘다 알파벳 가족의 일부입니다 Verily는 Google과 Google X에서 성장했습니다 그리고 우리는 전적으로 의료 및 생명 과학에 중점을두고 있습니다 우리의 사명은 세계의 건강 정보를 취하는 것입니다

환자가보다 건강한 삶을 누릴 수 있도록 유용하게 만듭니다 그리고 오늘 제가 이야기 할 예제는 당뇨병에 초점을 맞추고 있습니다 릴리가 시작한 대화에 정말로 도움이됩니다 하지만 일시 중지하는 것이 매우 중요하다고 생각합니다 건강 데이터를 광범위하게 생각해보십시오

현재 청중에있는 모든 개인 약 몇 기가 바이트의 건강 데이터가 있습니다 그러나 수년 동안 건강에 관해 생각한다면 유전체학에 관해서 생각해보고, 분자 기술, 이미징, 센서 데이터, 환자보고 데이터, 전자 건강 기록 우리는 엄청난 액수에 대해 이야기하고 있습니다 데이터, 기가 바이트의 데이터 그리고 Verily와 Alphabet에서 우리는 우리가 환자들을 도울 수 있도록이 일에 앞장설 것입니다 우리가 초기에 우리의 노력 중 일부를 집중하고있는 이유 당뇨병에 이것은 긴급한 건강 문제입니다

약 10 명 중 1 명이 당뇨병을 앓고 있습니다 당뇨병에 걸릴 때 시체에서 설탕 포도당을 어떻게 다룰 지 그리고 당신이 prediabetes에 대해서 생각한다면, 누군가 당뇨병에 걸리기 전에 조건, 3 명 중 1 명입니다 오늘 청중의 전체 중앙 섹션이 될 것입니다 이제 몸이 처리 할 때 어떤 일이 발생합니까? 포도당은 다른 방법으로, 당신은 다운 스트림 효과를 가질 수 있습니다

릴리가 당뇨병 성 망막증에 대해 이야기하는 것을 들었습니까? 사람들은 심장, 신장, 말초 신경 병증 이것이 우리가 앞서 나아갈 필요가있는 질병의 유형입니다 그러나 우리는 우리가 다루려고하는 두 가지 주요 쟁점을 가지고 있습니다 첫 번째는 정보 격차입니다 따라서 당뇨병 환자 중 가장 견고한 환자들조차도 – 우리 할아버지는이 중 하나 였어

하루에 네 번씩 혈당을 확인합니다 오늘이 누구인지 모르겠다 어떤 간식을 먹을 수 있습니다 나는 캐러멜 팝콘을 실제로 가지고 있었다 누구든지 그 중 하나가 있었나요? 그래, 대단하다

우리의 생물학과 우리의 포도당은 위아래로 가고 있습니다 그래서 제가 그 순간에 포도당을 검사하지 않으면, 우리는 그 데이터를 포착하지 못했을 것입니다 그래서 우리는 생물학이 항상 일어나고 있다는 것을 압니다 심장병 전문의로 병원에있는 환자를 볼 때, 나는 누군가의 심장 박동수, 혈압, 모든 것을 볼 수있다 이 생체 신호 중 실시간으로 그리고 사람들은 집으로 돌아가지만 생물학은 여전히 ​​일어나고 있습니다

따라서 정보 격차가 있습니다 특히 당뇨병 환자와의 차이 두 번째 쟁점은 의사 결정 갭입니다 1 년에 1 회, 1 년에 2 회, 그러나 매일 건강에 대한 결정이 내려지고 있습니다 그들은 매주, 매일, 매시간 일어나고 있습니다

그리고 우리는 어떻게이 격차를 좁히기로 결정합니까? 진실로 우리는 세 가지 핵심 사명에 집중하고 있습니다 그리고 이것은 거의 모든 프로젝트에 적용될 수 있습니다 우리는 교대하는 법을 생각하고 있습니다 에피소드 및 반응 치료에서 훨씬 예방적인 치료에 이르기까지 다양합니다 그리고 그 일을하고 요점을 이해하기 위해 우리는 실제로 AI의 힘을 사용할 수 있습니다

우리는 세 가지를해야합니다 올바른 데이터를 수집하는 것에 대해 생각해야합니다 그리고 오늘 저는 지속적인 포도당 모니터링에 대해 이야기 할 것입니다 그런 다음이 데이터를 어떻게 구성하여 형식으로되어 있는지 확인하십시오 우리는 환자의 잠금을 해제하고 활성화하여 진정으로 도움을 줄 수 있습니까? 그래서 우리가 당뇨병 분야에서 이것을 행하는 지 여부 오늘 또는 우리의 수술 로봇에 대해 듣게 될 것입니다

이것은 일반적인 전제입니다 생각할 첫 번째 사항은 데이터 수집입니다 그리고 릴리가 쓰레기를 말하면서, 쓰레기가 나옵니다 이해하지 못하면 통찰력을 찾을 수 없습니다 우리가보고있는 것

그리고 절대적으로 혁명적 인 한 가지 매우 작은 생체 적합성에 대해 생각하고있다 전자 제품 따라서 우리는 차세대 감지 기술을 연구하고 있습니다 그리고 여기에서 데모를 볼 수 있습니다 이것이 예를 들어, 매우 작은 연속 포도당 모니터가있는 곳에서 이러한 도구 중 일부를 만들기 위해 협력하고, 이것은보다 매끄러운 통합으로 이어질 것입니다

다시 한번, 당신은 단지 포도당 값이 얼마되지 않습니다 그러나 우리는 당신 몸이 어떻게 취급하고 있는지 이해합니다 설탕, 제 2 형 당뇨병 환자, 보다 지속적인 방식으로 그것은 또한 우리가 인구 수준에서 일어나는 일 그러나 개인적인 차원에서 일어날 수있는 일 특정 음식을 섭취 할 때 그리고 마지막으로 장치 비용을 줄이려고 노력합니다 그래서 우리는 건강을 정말로 민주화 할 수 있습니다

다음 목표는이 모든 데이터를 어떻게 구성 할 것인가입니다 그리고 저는 환자와 의사로서 말할 수 있습니다 사람들이 말할 수있는 것은 데이터가 놀랍고, 쓰나미로 데이터를 압도하지 마십시오 당신은 그것을 조직해야합니다 그래서 우리는 사노피와 파트너십을 맺었습니다

Onduo라는 회사에서 그리고 그 생각은 환자를 그들의 보살핌과 도움의 중심에 당뇨 관리를 단순화합니다 이것은 정말 누군가의 마음에 도착합니다 누가 더 행복하고 건강해질 것인가 그렇다면 실제로 무엇을 의미합니까? 우리가하려는 일은 사람들에게 힘을 실어주는 것입니다 그들의 포도당 제어와 함께

그래서 우리는 미국 당뇨병 협회 권장 포도당 범위를 살펴보십시오 그러면 사람들이 당신에게 보여주는 그래프를 얻습니다 하루의 모습과 시간의 비율 너는 범위 안에있다 다시, 환자 또는 사용자에게 제공 그 데이터는 그들이 결정의 중심이 될 수 있도록 – 마지막으로 Google 피트니스를 통해 단계를 추적합니다 다음 목표는 이해하려고 노력하는 것입니다

포도당이 당신의 활동과식이 요법과 어떻게 조화를 이루고 있는지 여기에는 프롬프트를 표시하는 앱이 있습니다 음식 사진 그리고 이미지 인식을 사용하고 Google의 TensorFlow를 사용하여, 우리는 음식을 식별 할 수 있습니다 그리고 이것이 진정한 개인적 통찰력이있는 곳입니다

진짜가되기 시작하십시오 왜냐하면 당신이 특정 식사를 먹으면, 몸이 어떻게 끝나는 지 이해하는 것이 도움이됩니다 그것과 관련있다 그리고 흥미로운 예비 자료가 있습니다 미생물이 변할 수 있음을 시사한다

내가 바나나에 반응 한 방식, 예를 들면, 그렇지 않으면 응답 할 수 있습니다 그리고 그것은 모두가 중요하기 때문에 중요합니다 우리가 만드는 일반적인 권고 사항이 갑자기 의사로서 누군가 나를 클리닉에서 보러 오면 2 형 당뇨병이 있습니다

여기 당신이해야 할 일들이 있습니다 당신은 당신의 다이어트, 운동, 구두 약을 복용하십시오 인슐린, 운동도 받아야합니다 당신은 당신의 발 의사, 당신의 눈을보아야 만합니다 의사, 주치의, 및 endocrinologist

그리고 그것은 통합 할 것이 많습니다 그래서 우리가하려고하는 것은 쌍입니다 이 모든 정보는 간병과 함께 간단한 방법으로 제공됩니다 이 여행을 돕는 사람입니다 이 정보가 떠오르면 내가 여기서 너에게 보여준 것의 가운데를 들여다 보면 의료지도와 그 사람이 보는 것, 당신은 여러 다른 라인을 볼 수 있습니다

드릴 다운하고 살펴보기를 바랍니다 이것은 데이터 간의 차이점을 보여줍니다 에피소드 식 포도당 예제에서 볼 수 있습니다 또는 지속적인 포도당 모니터로보고있는 것 이 새로운 감지로 가능합니다 그리고 우리가이 연속 포도당을 뚫어 말하며 모니터하고 우리는 일의 클러스터를 봅니다

이것은 하나의 예입니다 우리는 패턴을보기 시작할 것입니다 릴리가 언급했듯이 이것은 유형의 것이 아닙니다 개별 환자, 간병인 또는 의사가 파고 있지만, 여기가 당신은 학습 모델의 힘을 풀기 시작합니다 우리가 볼 수있는 것은 클러스터입니다

다른 아침의 우리는 긍정적 인 연관성을 만들거야 모두가 여기에서 믿을 수 없을만큼 건강하게 먹는다고 Google I / O에서 빨간색 아침의 클러스터가 될 수도 있습니다 하지만 우리는 일상 생활로 돌아가서 스트레스를받습니다 우리는 다른 종류의 음식을 먹고 있습니다

그러나 대신에, 일반적인 조언을하는 대신에, 우리는 다른 모델을 사용하여 지적 할 수 있습니다 뭔가 진행되고있는 것처럼 보입니다 예를 들어 환자 한 명과 수요일 즈음에 군집이 보였다 그래서 수요일에 무슨 일이 일어나고있는거야? 그 사람이 가고 멈추고 있는가? 특정 위치 또는 어쩌면 거기에 있습니다 그날 많은 스트레스

그러나 다시 한번, 일반적인주의를 기울이지 않고, 가장 포괄적 인 방법으로 치료를 시작할 수 있습니다 실용 가능한 예 다시 한번 우리가 말하는 것에 대해 생각해보십시오 데이터 수집, 구성 및 활성화 매우 관련성이 높습니다 이것이 우리가 당뇨병 관리에 관해 생각하는 방식입니다

이것이 바로 AI가 작동하는 방식입니다 우리는 오늘 아침 다른 토론에서 들었습니다 우리는 문제에 대해 생각해 봐야 해 우리는 이러한 도구를 사용하여 실제로 만들 것입니다 차이

그래서 우리가 생각할 수있는 다른 방법은 무엇입니까? 정보 활성화에 대해서? 그리고 릴리에게서 당뇨병 성 망막증 실명의 주요 원인 중 하나입니다 우리가 뛰어난 포도당 관리를하더라도, 말기 장기 손상이 시작될 수도 있습니다 그리고 나는 그 상승 된 포도당을 언급했다 레벨이 결국 안저 및 망막에 영향을 줄 수 있습니다 이제 당뇨병 환자들 심사를 받아야합니다

하지만 이전에 내가 너에게 준 이야기에서 우리가 환자에게 묻는 것의 세탁 목록 당뇨병에 걸린 사람 그래서이 공동 작업으로 우리가하려는 일은 구글과 함께, 어떻게 우리가 실제로 제품을 앞서 생각하고 생각하다 우리가 실현할 수 있도록 엔드 – 투 – 엔드 솔루션에 대해 오늘날 존재하는 어려움을 제거하십시오 이 문제는 상영에 관한 한 그 중 하나이기 때문에 내게 필요한 옵션이며 다른 하나는 검안의와 안과 의사에게 접근 할 수 있습니다

그리고 이것은 미국의 문제입니다 개발 도상국 에서뿐만 아니라 그래서 이것은 단지 문제가 아니라 지역적 문제입니다 이것은 우리가 매우 세계적으로 생각할 때입니다 우리는 해결책에 대해 생각합니다 우리는이 데이터를 일찍이 생각해 보았습니다

우리는 알고리즘을 사용할 수 있고 두 감도 모두를 높일 수 있습니다 당뇨 망막 병증의 진단과 특이도 황반부 종 그리고 이것은 "JAMA"에 게시 된 데이터입니다 릴리가 잘 설명했듯이 그렇다면 우리는 어떻게 생각할 것인가? 이 제품을 만드는 방법에 대해? 알파벳 같은 장소에서 일하는 것의 아름다움 오늘 당신과 같은 파트너와 함께 일하는 것이 우리 모두입니다

생각할 수있는 것, 우리가 해결해야 할 문제가 무엇인지, 알고리즘을 작성하십시오 그러나 우리는 그 때 뒤로 물러 설 필요가있다 보건 분야에서 활동한다는 의미 그리고 생명 과학의 공간에서? 우리는 이미지 획득, 알고리즘, 그 정보를 전달하는 것 의사뿐 아니라 환자에게도 도움이됩니다 우리가하는 일은이 정보를 취하는 것입니다 현재 일부 파트너와 협력하고 있습니다

현재 유망한 파일럿이 있습니다 인도에서와 마찬가지로, 우리는 듣고 싶습니다 이른 피드백 그리고 두 가지 정보가 있습니다 나는 너와 나누고 싶었다

하나는이 초기 관측을보고, 우리는 AI로 더 높은 정확도를보고 있습니다 더 큰 매뉴얼보다 의사로서 중요한 것은 – 방에 다른 의사가 있는지 나는 모른다 하지만 내가 항상 사람들에게 말하는 부분은 건강 관리 제공자를위한 공간이 될 것입니다 이 도구들이하는 일은 단지 우리가 일하는 것을 돕는 것입니다

그래서 때로는 사람들이 나에게 묻습니다 기술과 인공 지능입니다 의사를 대신하거나 의료 제도를 대체 할 것인가? 그리고 제가 생각하기에 그것은 단지 작품을 증대시키는 것입니다 우리는하다 청진기에 대해 생각한다면 – 그래서 저는 심장 전문의이고 청진기입니다

약 200 년 전에 발명되었습니다 우리가하는 일을 대체하지는 않습니다 그것은 단순히 우리가하는 일을 보강합니다 그리고 나는 우리가 계속하는 것과 비슷한 주제를 보게 될 것이라고 생각합니다 더 많은 것을 돌보는 방법에 대해 생각해보십시오

환자에게 효과적인 방법 그래서 여기서 가장 먼저 AI가 더 잘 수행되고 있다는 것입니다 수동 그레이더보다 그리고 두 번째로 생각하는 것입니다 그 환자 기초에 대해서

우리는 어떻게 진료를 진정으로 민주화합니까? 그리고 조종사에게서 다른 격려하는 조각 우리가 시작할 수있는 아이디어였다 알고리즘으로 치료받는 환자의 기반을 증가시킨다 이제 밝혀 졌을 때, 나는 좋아할 것입니다 건강하게 모든 것을하는 것이 정말 쉽다는 것을 말하고 있습니다 간호 및 생명 과학

그러나 그것이 나왔던 것에 따라, 그것은 거대한 마을을 필요로한다 이런 종류의 일을하는 것 그럼 다음은 뭐니? 임상 입양의 경로는 무엇입니까? 그리고 이것은 이것이 대단히 흥미로 웠습니다 많은 재능있는 기술자들과 일하는 의사가 되라 및 엔지니어 우리는 이제 다른 임상 사이트와 파트너가되어야합니다

나는 여기서 언급했다 우리는 또한 FDA, 유럽 ​​및 그 밖의 규제 기관들도 마찬가지입니다 우리가하기로 결정한 진실로 한 가지 FDA 사전 인증이라고 불리는 것에 속하는 것입니다 프로그램 우리는 새로운 기술과 새로운 알고리즘 의료 보험에 가입하는 것이 중요하지만 지금은 그 방법을 알아 내야합니다

둘 다 안전하고 효과적입니다 그리고 저는 Alphabet에서 우리를 자랑스럽게 생각합니다 앞서 나가고 파트너 관계를 유지하십시오 FDA와 같은 단체들과 주의해야 할 두 번째 사항 우리가 진실로 진실로 Google 및 Nikon 및 Optus와 같은 다른 파트너와 함께 이 모든 것들이 모여 든다 진료를 변형시키려는 시도

그러나 나는 이것이 올바르게하면, 당뇨병뿐만 아니라 실제로 큰 기회가 있습니다 건강 정보의 전 세계에서 그것에 대해 생각하는 것은 흥미 롭습니다 내 시간을 대부분 보살 피는 의사로서 병원에있는 환자의 보살핌에 더 많은 접근을 시작하십시오 병원 밖에서? 하지만 우리가 잘한다면 우리가 앞서 나가면이 격차를 좁힐 수 있습니다 더 예방적인 방법을 찾아 낼 수 있습니다

우리는 올바른 정보를 수집 할 수 있습니다 우리는 인프라를 구성하여이를 구성 할 수 있습니다 그리고 가장 중요한 것은 그것을 활성화하는 방법을 알아낼 것입니다 그러나 나는 모두가 여기에서 알고 싶어한다 이것은 우리가 홀로 할 수있는 일이 아닙니다

정말로 우리 모두를 필요로합니다 그리고 Verily, 우리는 Google에, 우리는 Alphabet 여러분 모두와 함께 할 수 있기를 기대합니다 그래서이 여행에서 우리를 도와주세요 이 대화 후에 릴리와 나는 여기있을 것이다 우리는 여러분 모두와 행복하게 대화 할 수 있습니다

I / O에서 시간을내어 주셔서 감사합니다 [음악 재생]

AI Adventures: art, science, and tools of machine learning (Google I/O ’18)

[음악 재생] YUFENG GUO : 아침 내 이름은 Yufeng Guo이고 YouTube에서 비디오 시리즈를 진행합니다

인공 지능 어드벤처 (AI Adventures)라는 곳에서는 예술, 과학, 기계 학습 도구 저는 오늘 그곳에있는 작은 조각을 직접 가져오고 싶었습니다 그럼 함께 인공 지능 모험을 떠나 봅시다 이 세션의 목적을 위해, 먼저 기계 학습에 대한 짧은 정의부터 시작해 보겠습니다 그것을 사용하여 워크 플로우를 구축하십시오

도구에 들어가십시오 우리는 오늘 그것을 사용하여 도움을 줄 것입니다 우리는 기계 학습 문제를 어떻게 해결할 수 있는지보고 있으며, 문제를 해결하는 데 어떻게 활용할 수 있는지 알아보십시오 I / O 외부 그래서 우리는 기계 학습을 말할 것입니다 데이터로 프로그래밍하고 있습니다

그리고이 데이터를 사용하여 시스템 또는 모델을 생성합니다 어떤 일을하도록 훈련 받았다 그리고 우리는 데이터를 사용하여 매우 중요한이 모델을 교육합니다 그리고 모든 것이 다시 데이터로 돌아옵니다 이것이 실제로 기계의 첫 번째 단계입니다

학습 – 데이터 수집 그것은 모두 중심에 있고 거기에서 시작됩니다 다음으로, 일반적으로 일종의 준비가 있습니다 해당 데이터가 필요합니다 원시 데이터는 종종 사용하기에 적합하지 않습니다

그래서 우리는 조금 준비해야합니다 귀하의 기계 학습 준비가되기 전에 셋째, 모델을 선택해야합니다 우리는 그것을 사용하고, 훈련시키고, 평가하기를 원합니다 그 성능, 미세 조정, 마지막으로 그러한 예측을하십시오

그래서 우리는이 7 가지 단계를 각각 거치게됩니다 이 세션의 과정에서 먼저 질문을 봅시다 우리는 우리 모델을 사용하여 첫 번째 문제를 해결하려고 노력하고 있습니다 간단한 예제 데이터 세트를 살펴 보겠습니다 이 7 단계를 통해 분류 작업을 수행하십시오

동물에 관한 데이터 우리는 어떤 종류의 동물이냐고 말할 것입니다 일부 입력 데이터를 기반으로합니다 이것이 새입니까? 그것은 포유 동물인가? 그것은 파충류 물고기, 또는 양서류, 버그, 또는 무척추 동물? 이 7 가지 유형 중 하나 그리고 그것은 다양한 통계에 기초 할 것입니다

주어진 동물에 대해서 따라서 우리 모델은이 데이터,이 구조화 된 데이터, 그것을 사용하여 예측을 시도하십시오 -이 7 가지 중 하나 동물의 종류 이제 우리는 어떤 상황이 우리는 모델링을하고 있습니다 이 단계들을 더 자세히 설명합니다 우선, 데이터 수집 중입니다

우리는 어떤 문제인지 알고 있기 때문에 우리는 해결하려고 노력하고 있습니다 항상 그렇지는 않습니다 이를 해결하기 위해 필요한 데이터가 있음을 의미합니다 데이터가 없으면 모델이 아무 곳에도 없습니다 그래서 내 데이터가 어디에서 어떤 형식으로 살고 있는지 스스로에게 물어보십시오

어떻게해야합니까? 이들은 종종 초기 걸림돌이다 우리는 문제를 해결하고 해결하기 위해 데이터를 사용하려고 노력합니다 그리고 아마도 당신은 실제로 상황에 처해 있습니다 필요한 모든 데이터가없는 곳입니다 자신의 데이터를 수집해야합니다

이것은 또한 일반적인 사용 사례입니다 그리고 당신은이 문제를 푸는데 독창적이 될 수 있습니다 데이터 수집을위한 시스템을 구축함으로써, 아마도 당신은 그것을 게임으로 만들 것입니다 정말 재미있는 예가 Quickdraw입니다 Quickdraw는 온라인 게임으로 당신은 특정 그림을 그려서 시도합니다

네가 그리는 것을 예측하는거야 그래서 그것은 당신에게 농구를 그리거나 배를 그립니다 그리고 당신도 알다시피, 그것은 재미 있습니다 사람들은 그것을 좋아합니다 결과적으로 게임이 생성되었습니다

십억 개 이상의 손으로 그린 ​​이미지의 기념일 로고 전 세계에서 그리고이 데이터 세트는 GitHub에서 오픈 소스입니다 실제로 AI 모험 에피소드가 있습니다 이 데이터 세트를 사용하는 방법에 대해 자세히 알고 싶으면 놓으십시오 그걸 가지고 놀아 라

하지만 우리의 계단으로 돌아가 우리는 데이터를 수집했습니다 무엇 향후 계획? 우리는 그 데이터를 준비해야합니다 데이터 준비는 완전히 별도의 대화가 될 수 있습니다 여기서는 몇 가지 측면 만 다루겠습니다

어떤 종류의 기계 학습을하기 전에 데이터를 탐색하십시오 실제로 데이터를 더 잘 이해하는 데 도움이 될 수 있습니다 이것이 당신에게주는 것이기 때문에 이것은 근본입니다 데이터 세트에 대한이 직관, 당신에게 많은 시간과 두통을 줄 수 있습니다 나중에 그 과정에서

그래서 저는 사람들이 그들의 데이터를 청소하도록 권장합니다 데이터를보고 그것에 대해 어떤 종류의 직감을 얻으 려합니다 간격을 확인하는 데 도움이됩니다 그 길을 따라 일하는 것에 대해 많은 것을 배웁니다 그리고 실제로 더 많은 데이터가 필요하다는 것을 알게 될 것입니다

또는 수집 한 특정 데이터 결국 실제로 그렇게 유용하지는 않았습니다 이 작업을 수행하기 위해 내가 좋아하는 도구 중 하나는 Facets입니다 우리는 잠시 우회하여 그것에 대해 이야기 할 것입니다 패싯은 오픈 소스 데이터 시각화입니다 Google Research의 도구입니다

데이터 배포에 대한 더 나은 이해를 얻을 수 있습니다 그리고 네, 가능한 많은 도구가 있습니다 당신은 아주 비슷한 일을합니다 명령 및 호출 함수를 작성할 수 있으며, 하지만이 모든 것이 한 곳에서 이루어집니다 UI이기 때문에 잊지 않을 것입니다

특정 통계를 계산하는 것 또는 데이터의 일부를 살펴보십시오 그것은 모두 당신을 위해 계산 되었기 때문입니다 그냥 나타납니다 그래서, 당신은 그냥 찾아 볼 수 있습니다 여기에서 우리의 데이터 세트에 적용된 패싯을 볼 수 있습니다

동물원에서 나온이 동물들 중 대부분은 일종의 것들이며 제로 데이터 세트는 호흡합니까? 꼬리가 있습니까? 깃털이 있니? 그런 것들 그래서 우리는 이런 종류의 재미있는 분포를 0으로 보았습니다 ~ 1 그러나 숫자 배포판을 사용하는 많은 경우, 훨씬 더 흥미로운 것을 보게 될 것입니다 자, 기계의 세 번째 단계로 넘어 갑시다

학습 – 모델 선택 그리고 우리는 모델 선택에 대해 조금 논의 할 것이고, 우리가 이것을 사용하는 방법에 대해 가능한 최소한의 노력 그리고 먼저, 주위에 직감을 구축합시다 기계 학습 모델이 잘 작동합니다 그래서 여기에서 우리는 모델이 어떻게 시도 하는지를 봅니다

우리가 말하려고하는 지역을 나누기 위해, 어느 쪽이 파란색이고, 어느 쪽이 주황인지, 점들인 데이터와 일치시킵니다 따라서 세계에서 가장 어려운 사례는 아닙니다 권리? 모든 것이 이미 영원히 분리되어 있습니다 분리했다 그러나 좀 더 재미있는 것을 보도록하겠습니다

여기, 우리는 약간의 모델 투쟁을 본다 그 동그라미를 그리는 방법을 찾으려고 시도 할 때 파란색 점 주위 그리고 이러한 도구가 오늘 당신에게 사용 가능하며, 충분히 정교합니다 당신을위한 모든 사소한 부분을 다룰 수 있습니다 그래서 당신은 어떻게에 대한 세부 사항을 걱정할 필요가 없습니다

그것에 대해지고있다 그것은 그 일을 성취하는 것의 문제 일뿐입니다 그러나 보는 재미입니다 또한 서로 다른 모델이 서로 다른 종류의 데이터를 모델링 할 수 있습니다 복잡한 정도가 다르다

그래서 이것이 모델 선택이 실제로 무엇인지에 대한 것입니다 그것은 어떤 모델이 딱 맞는지를 보는 것입니다 특정 데이터 세트 및 특정 문제 당신은 풀려고 노력하고 있습니다 이제 구체적으로, 우리가하려고하는 것 이것을 달성하기 위해 TensorFlow를 사용합니다 그래서 TensorFlow에 관해 많은 이야기가 있습니다

여기에 I / O에서 올해, 그래서 그 비트를 rehash하지 않습니다 그러나 우리는 예를 들어, 아마도, TensorFlow를 사용하여 모델을 수행하는 모습 선택, 실제로 그 코드를 쓰려면, 특히 경험치가 너무 많지 않은 경우 TensorFlow와 함께, 이것은 친절 할 수 있습니다 얼마나 쉽게 접근 할 수 있는지에 대한 유용한 정보를 제공합니다 이것은 선형 분류 자의 예입니다 우리가 본 첫 번째 애니메이션과 비슷합니다

드로잉은 두 공간 사이에 선형 선이 좋습니다 그리고 우리는 그것이 매우 간단하다는 것을 알 수 있습니다 그러나 더 복잡한 데이터가 있다면 어떨까요? 이 한 줄 전화는 음, 일종의 전화를 유지합니다 당신이 다른 모델에서 그것을 시도 할 때 그래서 우리는이 것을 깊은 신경 네트워크로 대체 할 것입니다

몇 가지 작은 수정이 필요합니다 이 경우에는 추가 인수 하나를 추가해야합니다 숨겨진 단위라고합니다 이것은 우리 네트워크의 구조를 정의합니다 이 경우, 우리는 30, 20, 10 개의 뉴런이 있습니다

그래서, 우리가해야 할 일은 말 그대로, 그냥 이름 바꾸기 – 그 텍스트를 대체하고 하나의 인수를 추가하십시오 전체 시스템을 다시 연결할 필요는 없습니다 모든 것을 삭제하고 시작할 필요가 없습니다 기스로부터 그래서 그것은 정말로 산뜻합니다

그리고 시도 할 수있는 다른 모델과 비슷합니다 많은 사람들이 모델을 뒤집습니다 메소드 호출의 이러한 다양한 선택 메뉴로 놀 수 있습니다 그리고 그 패러다임에서 미리 모델에 커밋하지 않아도됩니다 한 번 시도해보고 어떻게 작동하는지보고 다시 돌아올 수 있습니다

이 7 단계 때문에, 그리고 당신은 다시 반복 할 수 있습니다 언제든지 돌아가서 돌아볼 수 있습니다 그래서 우리를 다음 단계로 인도합니다 우리는 데이터를 수집했습니다 우리는 그것을 준비했습니다

우리는 최소한 모델을 선택했습니다 그리고 지금, 우리는 훈련을 할 수 있습니다 교육은 많은 관심을 얻습니다 왜냐하면 그것은 어떤면에서 마법이 일어나는 곳이기 때문입니다 그러나 실제로, 그것은 종종 매우 간단합니다

너는 그냥 뛰게하고 기다린다 그럼 훈련 도중 무슨 일이 일어나는지 살펴 보겠습니다 코드에서 볼 수 있습니다 개념적으로 모델을 훈련 할 때 우리는 데이터를 전달합니다 우리는 즉시 모델을 통해 예측을 시도합니다

그러나 예측은 꽤 나쁠 것입니다 왜냐하면 우리 모델은 무작위로 초기화되기 때문입니다 그러나 우리는이 예측을하고 그것을 취하여 비교합니다 진정한 대답, 우리가 알고있는 정답 그리고이 정보를 사용하여 모델을 업데이트합니다

따라서 모델을 검토하고 업데이트 할 때마다 작동하면서 새로운 데이터 조각으로 훈련 세트를 통과하는 길, 시간이 지남에 따라 모델이 더 좋아질 수 있습니다 각 교육 루프와 함께 따라서 교육 과정은 이와 같습니다 그러나 실제로, 코드를 실제로 작성해야 할 때, 우리는 모델을 만든 우리의 기능을 사용합니다 그리고 우리는 방금 그것에 도트 트레인을 불렀다

그것은 문자 적으로 한 줄입니다 당신은 그 기능을 제공 할 필요가 있습니다 교육 데이터 입력을 제공합니다 그것은 한 줄입니다 그리고 일단 훈련이 끝나면 – 이 기능을 실행하면 꺼져서 샌드위치를 ​​잡고, 그리고 당신은 돌아오고 평가를 할 시간입니다

우리는 우리 모델을 평가해야합니다 그것이 얼마나 정확한지 보는 것입니다 기본 작업을 잘 수행하는지 확인하십시오 그래서 우리는 사물의 몇 가지 예를 보여줄 수 있습니다 우리가 올바른 답을 알고 있다는 것, 모델은 훈련에서 이러한 질문을 보지 못했습니다

그것은 훈련에서 그 데이터를 보지 못했습니다 따라서 우리가 따로 설정 한이 평가 데이터를 사용합니다 우리 모델의 성능을 측정합니다 개념 상으로는 교육과 매우 유사합니다 여전히 같은 모양입니다

그러나 중요한 차이점은 상단에 화살표가 없습니다 그것은 폐쇄 루프가 아닙니다 예측을 확인하면 모델이 업데이트되지 않습니다 결과 그리고 모델을 업데이트 한 경우, 그러면 그것은 훈련과 다를 바 없으며, 우리는 본질적으로 속일거야

따라서 평가 데이터는 그런 식으로 소중합니다 모델을 업데이트하는 데 사용하지 않습니다 우리는 그것을 옆으로 잡고 그것을 예비 해 둔다 우리 모델의 성능을 평가할 수 있습니다 코드에서는, 우리가 본 모든 것만 큼 간단합니다

우리는 점 평가를 호출합니다 평가하고 싶다면 점 평가를 호출하십시오 그리고 우리가 평가 데이터를 전달하고 있음을 주목하십시오 그것은 eval 입력 함수입니다 따라서 교육 자료가 아닙니다

그리고 우리가 훈련 데이터를 사용한다면 – 우리는 그 줄을 복사했다고 가정 해 봅시다 우리는 방금 스왑 아웃, 평가를 위해 훈련, 데이터 소스를 변경하는 것을 잊었습니다 이제 우리는 우리 모델의 성능을 훈련 데이터, 그리고 그것은 큰 실수가 될 것입니다, 모델이 교육 데이터를 위해 최적화 되었기 때문입니다 따라서 동일한 데이터를 사용하여 평가할 경우 어떤 일이 발생합니까? 당신이 당신의 모델의 진정한 성과를 허위 진술하고, 실제 데이터에서 제대로 수행되지 않을 가능성이 있습니다 한 번 배포하면 결코 볼 수 없으므로 그리고 당신은 그것이 어떻게하는지 결코 측정하지 못했습니다 이전에 보이지 않는 데이터와 그래서 이것은 우리를 다음 단계로 안내합니다

그러면 우리는 실제로 모델을 어떻게 개선 할 수 있습니까? 우리는 훈련을 실시했다 우린이 짓을 했어 우리는 평가를 실행했습니다 이제 뭐? 우리는 더 많은 훈련을 받고 있습니까? 우리는 그것을 어떻게 더 조정할 수 있습니까? 우리는 언제나 새로운 모델로 교체 할 수 있습니다 그러나 우리가이 모델을 결정한다면, 그러나 우리는 그것을 향상시키고 자 하는가? 여기서 하이퍼 파라미터 튜닝이 이루어집니다

이 모델들은 그들 자신의 매개 변수를 가지고 있으며, 그러나 우리는 어떤 가치를 사용해야합니까? 그리고 우리는 그들을 어떻게 골라야합니까? 다른 모델을 시험해 볼 수있는 것처럼, 당신은 또한 다양한 모델 파라미터를 시험해 볼 수 있습니다 이 과정은 하이퍼 파라미터 튜닝이라고 불리며, 어떤면에서는 여전히 연구 활동의 영역으로 남아 있습니다 그러나 그것이 당신이 그것을 이용할 수 없다는 것을 의미하지는 않습니다 개념적으로, 우리는 우리의 훈련을받습니다, 한 모델 만 교육하는 대신, 그 모델을 조정할 것입니다 다양한 변형을 만들 수 있습니다

그래서 우리는 다양한 변형에 대한 교육을 실시 할 것입니다 같은 기본 모델이지만 다른 모델 매개 변수를 사용하여 정확도에 미치는 영향을 확인하십시오 그래서 우리는이 모든 변형들을 훈련하고 평가할 것입니다 동일하거나 유사한 모델을 선택하고 어느 것이 가장 잘하는 지보십시오 그것이 우리의 매개 변수 선택을 알리는 방법입니다

그러나 당신은 많은 것을 실험적으로 보았습니다 당신은 그 (것)들을 작동하기 위하여 보는 시도해야한다 따라서 네 루프를 벗어나야 할 수도 있습니다 그래서 좋은 하이퍼 매개 변수를 선택하는 작업입니다 아마도 당신이 이것을 직관했을 것입니다

당신은 아마 기계 학습 문제로 변할 수 있습니다 그 자체– 모델의 매개 변수 최적화 당신이 기계 학습을 위해 사용하고있는 그러나 우리는 다른 대화를 위해 그것을 구해야 할 것입니다 그래서 우리는 데이터를 수집했습니다 우리는 그것을 준비하고 모델을 선택하고 그것을 훈련 시켰습니다 데이터를 평가하고 하이퍼 매개 변수를 조정했습니다

마침내 우리는 마지막 단계에 도달했습니다 그 예측을합니다 이것은 훈련의 전체 요점이다 처음에는 모델이었습니다 정말 정확한 정확성을 얻는 것이 아니라, 또는 서버에 열을 가할 수 있습니다

실제로 그걸로 뭔가 유용한 일을하는 것이 었습니다 그래서 예측을하면 모델을 선택합니다 우리는 어딘가에 그것을 배치하거나 우리가 그것을 격리시켜, 우리는 모델에 그것이 가지고 있지 않은 일부 데이터를 보여줄 수있다 훈련을받은 후 어떤 결과물을 보는지 그것은 예측한다 그리고 그것은 우리의 7 단계입니다

기계 학습의 개념적 7 단계입니다 실제로 실제로 어떻게 보이는지 봅시다 우리는 사물의 툴링 측면으로 돌아갈 것입니다 TensorFlow 외에도 사용하는 것을 살펴보십시오 실제로이 7 가지 단계를 어떻게 달성 할 수 있는지에 대해 설명합니다

그래서 우리는 몇 가지 코드를 살펴볼 것입니다 특히 두 가지 도구가 제공됩니다 우리가 손을 잡을 테니 추가 리소스도 참조하십시오 먼저 Co Lab이라는 도구가 있습니다 어떤 종류의 노트북 환경에서도 작업 한 적이 있다면 또는 REPL을 웹에서 사용하기 전에 기본적으로 브라우저에서 Python을 실행하는 방법입니다

그러나 파이썬 만 실행하는 것이 아니라 전체적인 노트북 환경입니다 마크 다운, 코드 실행, 기본적으로 Google 드라이브에 호스팅되기 때문에 다른 사람들과 공유 할 수 있습니다 이제 데모로 전환 해 보겠습니다 CO Lab을 사용하는 모습을 보여줄 수 있습니다 그래서 우리는 여기 – 나는 Co Lab을로드하고 우리는 다양한 명령을 실행할 수 있습니다

모든 것 우리는 기대할 것입니다 이제 우리는 여전히 연결되어 있습니다 Co Lab에서는, 그것은 노트북 환경이기 때문에, 자신의 파일을 업로드해야합니다 인터넷에 연결되므로 인증 할 수도 있습니다 물건을 끌어 내려요

필자의 경우에는 데이터 세트가 머신에로드되었습니다 그리고 우리는 그것을 다운로드 할 수 있습니다 그리고 판다가 여기에 실려 있습니다 따라서 우리는 데이터 세트를 살펴볼 수 있습니다 약속대로, 그것은 동물의 무리 다

그리고 많은 통계 자료들, 그리고 결국, 클래스 유형이 있습니다 그래서 Co Lab에서는 실제로 코드를 실행할 수 있습니다 화면에 – 음, 실시간으로 또한 Google 드라이브에서 모두 호스팅되기 때문에, 백그라운드에서 어떤 기계를 돌려야 할 필요는 없습니다 그냥 원활하게 작동합니다

그리고 다른 사람들과 의견을주고 다른 사람들과 의견을 나눌 수 있습니다 과– 거기에 우리가 간다 일반적으로 공동 연구를하거나 일을해야합니다 그래서 그것은 정말로 산뜻합니다 그래서

보자 내 생각 엔 시간이 좀있어 그러니 실제로 내가 여기서 뭘했는지 조금 지나쳐

우리는 데이터를 가져 왔고, 내가하고있는 일은 그것을 섞은 다음 데이터를 분할합니다 그래서 우리는 전체 데이터 세트를 가지고있었습니다 이 전체 데이터 세트는 101 개의 다른 동물로 구성됩니다 아마도 가장 작은 데이터 세트 일 것입니다 아마 내가 만났을거야

하지만 여전히 동일한 유형의 모범 사례를 수행해야합니다 이 경우, 나는 그것을 가져 와서 나누었습니다 교육 및 평가 데이터로 변환합니다 왜냐하면 내가 훈련을하기 위해 모두 101을 사용한다면, 내 모델을 평가하기 위해 무엇을 할 것입니까? 그래서 우리는 그것을 나눌 것입니다 이 경우 나는 60 %와 40 %의 비율을 선택했다

그 비율은 조정될 수 있습니다 그리고 우리는 우리가 볼 수 있습니다, 우리는 우리의 훈련 데이터 – 모든 60 값 그리고 우리는 아래의 평가 데이터를 가지고 있습니다 그리고 저는 약간의 전처리를합니다 이것은 귀하의 데이터 비트 처리입니다

특히 데이터 세트의 마지막 열은 레이블입니다 그것은 대답이다 올바른 유형의 동물의 1에서 7까지 그것은 파충류, 양서류, 포유류 등입니다 문제는 레이블이 1에서 7로 이동한다는 것입니다 그리고 나는 그들에게 6을 통해 0이 될 필요가있다 이 특별한 경우에 그래서 나는 그것을 하나씩 뺍니다

하나를 뺍니다 그리고 그게 전부입니다 아주 간단한 사전 처리 아마 더 큰 데이터가, 아마, 더 많은 일을 할 것입니다 그리고 우리는 우리의 데이터가 분명히, 나는이 일을하지 않았다

항상 코드를 실행하십시오 여기에 우리의 입력 함수는 매우 간단합니다 우리의 원시 데이터가 필요하며, 만약 우리가 그것을 원한다면, 데이터 세트에서 임의로 호출 할 수 있습니다 그리고 나는 필요에 따라 반복하고 배치를 청크로 만들었습니다 그래서 이것은 훈련에 바로 들어가게 될 것입니다

데이터 세트에 대한 이야기가 있었다고 생각합니다 구체적으로는 입출력이 빠릅니다 그래서 놓친다면 녹음을들을 수 있어요 또는 라이브 스트림을 롤백 할 수 있습니다 그래서 우리는 데이터 집합을 가지고 있습니다

또는 우리의 입력 기능 그리고 나는 세포를 다시 돌리는 것을 잊었다 고 생각합니다 그리고 이것은 제가 여기있는 작은 세포입니다 내 입력 기능을 시험해보기 위해, 작동하는지 확인하려면 – 항상 물건을 테스트하는 것이 좋다 그래서, 우리는 입력 기능이 실제로 있다는 것을 알 수 있습니다

깃털의 각 유형에 대한 모든 데이터를 반환합니다 알을 낳고, 공중에 무엇이 있고, 백본이 있는가? 그런 것들 따라서 각 배열은 일괄 처리 된 데이터를 나타냅니다 그리고 나는 또한 이것으로 놀고 있었다 각 열의 고유 한 값을 확인하는 것 대부분이 1과 0이라는 것을 확인하기 위해, 그러나 조금 이상한 몇 가지가 있습니다

예를 들어, 5 개의 다리가있는 동물이 있습니다 따라서 모든 데이터 세트가 완벽하지는 않습니다 TensorFlow는이 기능 항목 개념을 사용합니다 들어오는 데이터를 나타냅니다 모델은 매우 일반적이므로 기능 열을 사용하여, 특정 데이터 세트에 맞게 사용자 정의 할 수 있습니다

우리의 경우 모든 데이터 (모든 열, 그 중 숫자 17 인 17 개가 모두 그것을 숫자로 설정하십시오 그래서 그것은 단지 구성입니다 TensorFlow에 몇 개의 열과 어떤 유형이 있는지 알려주 들어오고있어 그래서 우리는 그것을 실행할 것입니다 그리고 일이 깨면 그것은 내가 셀을 실행하는 것을 잊어 버렸으므로, 그렇게되면 저에게 소리를 지르십시오

그리고 여기에 우리가 전에 본 선이 있습니다 모델 생성과 함께 여기서는 선형 분류자를 만들고, 해당 지형지 물을 가져오고, 7 개의 다른 클래스가 있다고 말하자 동물에 대해 가능한 다른 값 기차와 평가를 결합했습니다 기차를 타고 함수를 함수로 평가한다

편의를 위해, 그래서 그들은 둘 다 함께 달린다 나는 훈련 자료를 훈련시키고 싶다 평가 데이터에 대한 평가를 실행하고 싶습니다 이렇게 함께 배치하면 세포를 재실행 할 때 버그가 생기지 않도록하십시오 네가 따라갈 때

선형 모델을 실행한다고 가정 해 봅시다 우리는 그 방향을 돌립니다 따라서이 모든 것이 Google의 서버에 의해 뒷받침됩니다 그리고 명백하게, 그것은 그것의 달콤한 시간을 보내고 있습니다 그것이하는 동안 – 글쎄, 이건 끝났어

그래서 우리는 90 %를 얻었습니다 이것은 OK와 같습니다 맞습니까? 100 개의 행만있었습니다 우리는 훈련을 위해 60 명을 가져 갔고 평가를 위해 40 명을 사용했습니다 그래서 그것은 가장 신뢰할만한 척도가 아닙니다

여기에 도구가 있다는 아이디어가 있습니다 코드가 있습니다 이를 자신의 데이터로 바꾸어야합니다 이 데이터 세트보다 훨씬 좋을 것입니다 멋진 결과를 얻을 수 있습니다

따라서 약속대로, 심 신경 네트워크는 매우 유사합니다 그것은 문자 적으로 이전과 동일합니다 그러나 나는 그것을 숨겨진 단위로 바꿨다 나는 주목할만한 차이가 하나 있다고 생각한다 내가 이전 기능을 사용한다는 것입니다

우리가 전에 가지고 있었던 컬럼들 표시기 열에 그래서 이것은 선형 네트워크를 배치하기위한 공간 일뿐입니다 데이터를 심 신경 네트워크가 표현할 수있는 방식으로 변환합니다 그래서이 이야기의 범위를 벗어났습니다 하지만 그것은 단지 깊은 신경 네트워크를위한 조정입니다

선형 네트워크는 처리 할 필요가 없습니다 그래서 우리는 그것이 만들어 지도록 할 것입니다 죄송합니다 방금 새 셀을 만들었습니다 그래서, 그것은 또한 여기에서 과시하는 것이 좋습니다

따라서 우리는 매우 쉽게 코드 블록과 셀 블록을 생성 할 수 있습니다 그 사이에 모든 종류의 훌륭한 편집 작업을 할 수 있습니다 능력은 여기에 있습니다 그리고 당신은 그것을 markdown으로 바꿀 수 있습니다 셀을 실행합니다

그리고 거기에있을거야 그래서 깊은 네트워크 – 내가 이것을 도망 간다는 것을 잊어 버린다 어쩌면 우리는 그것을 다시 실행할 것입니다 모델을 더욱 밀어 넣을 수도 있습니다 여기 백분율은 때로는 불안정합니다

왜냐하면 그들은 – 평가 데이터에는 40 개의 값만 있기 때문에, 이것은 사실입니다 40 세가 넘는 사람들이 올바르게 받아들이고 있습니다 다른 것들은 틀린 것입니다 그래서이 경우 10 %, 아마도 약 4 % 잘못되었거나 3 ~ 4 개가 잘못되었습니다 그래서 몇 가지 예언을하고 놓친 것을 봅시다

TensorFlow에는 도트 예측 기능도 있습니다 마치 기차와 도트를 평가하는 것과 같습니다 그래서, 당신은 통과 할 수 있습니다 방금 평가 자료를 가져 와서 몇 장을 나눠 냈어 보십시오보기의보기

그래서 우리는 우리가 그렇게 할 때, 당신은 예측과 올바른 대답을 얻습니다 그래서이 경우, 내가 임의로 선택한 다섯 가지 일이 생겼어 그러나 우리가 잘못한 정확한 것을보고 싶다면 어떻게해야할까요? 그래서 이것은 내가 도망친 작은 실험이었다 단지 내가 궁금해서 – 어느 것이 선형 네트워크가 잘못되었는지 그리고 어떤 것들은 깊은 네트워크가 잘못 되었습니까? 이 경우에는 서로 다릅니다 그들은 같은 숫자의 잘못된 예측을 가지고 있습니다

그들은 모두 네 가지가 잘못되었지만 실제로는 다른 예 그리고 이것은 더 깊이 파고들 수있는 기회가 될 것입니다, 그걸 가지고 놀아 라 마지막으로 내가 추가 할 것은 Co Lab 또는 Co Laboratory입니다 GPU를 지원합니다 그래서 GPU를 토글 할 수 있습니다

큰 데이터 세트와 멋진 모델이 있다면, 그런 종류의 물건에 액세스하고 그 GPU를 얻고 싶습니다 슬라이드로 돌아가 봅시다 간단히 살펴보고 다른 도구를 살펴보십시오 CO 연구실 외에 다른 도구가 있습니다 우리는 매우 유사합니다

노트북 기반이기 때문에 들어 보셨을 것입니다 그것은 Kaggle이라고합니다 그리고 Kaggle이 대회로 가장 유명하지만 토론 포럼 및 데이터 세트, 또한 Kernels라는 기능이 있습니다 그리고 커널은 실제로 노트북의 멋진 이름입니다 그리고 커널은 이런 모습입니다

Co Lab에서 익숙해지기 시작할 수도 있습니다 파란색은 제외하고 그리고 커널은 몇 가지 미묘한 차이가 있습니다 첫째, 나는 ~하고 싶다 Kaggle Kernels의 데모로 전환 해 보겠습니다

우리는 그 모습을 볼 것입니다 어떻게한다는거야? 그래서 저는 이전에 Co Lab에서 가지고 있던 노트북을 가져갔습니다 나는 노트북 자체를 다운로드했다 IPython 노트북 파일로 Kaggle에는 데이터 세트가 있기 때문에 실제로 동물원 동물 분류 데이터 세트가 있습니다

정확한 데이터 세트를 얼마나 편리하게 선택했는지 그것은 이미 Kaggle에 존재합니다 그래서 새로운 커널을 클릭 할 수 있습니다 노트북을 고를거야 그리고 Kaggle Kernels는 파이썬에서 동작 할뿐만 아니라, R에서 실행하도록 선택할 수도 있습니다 R을 선호합니다

제가 할 수있는 일은 실제로 제가 할 수있는 일입니다 노트북 업로드 – 음, 먼저 그 노트를 다운로드해야합니다 그럼 그렇게 하죠 그래서 Co Lab에서 우리는 다운로드 할 것입니다 – 이것은 내가 크게 확대하는 것입니다 책을 다운로드하십시오

그런 다음 다운로드가 완료되면 그 노트를 다시 Kaggle Kernels에 업로드 할 수 있습니다 그래서 붐

커널과 동일한 노트가 있습니다 하나의 작은 비틀기가 있습니다 로컬 드라이브에서 파일을 업로드해야했기 때문에, Co Lab을 위해, 우리는 그것을 제거 할 것입니다 그리고 유일한 다른 조정은 Kaggle Kernels에서 데이터입니다 입력이라고하는 하나의 디렉토리에 있습니다

첫 번째 셀을 실행하면 우리는 아래로 나아갈 것입니다 우리는 데이터가 입력에서 살아 있음을 볼 것입니다 그리고 그것은 같은 종류의 것입니다 그리고 우리는 이미 노트북의 나머지 부분을 보았 기 때문에, 그것은 문자 적으로 같은 것입니다 재미있는 것은, 커널에서, 우리는 할 수 있습니다

어디 보자 이름을 지어 보자 그리고 우리는 그 노트를 저 지르 수 있습니다

그리고 Kaggle Kernels이하는 일은 그것입니다 새로운 신선한 환경에서 노트북을 운영 할 것이며, 당신이 속한 세션과는 별도로 그러면 모든 출력이있는 노트북이 생성됩니다 우리가 일종의 훌륭한보기 전용 형식으로보고있는 정말 공유에 유용합니다 왜냐하면 당신이 당신의 노트를 공유하고 싶다면, 그것이 실행 된 방법뿐만 아니라 다른 사람들에게도 마찬가지입니다 재현 가능한 노트북을 원한다면 우리가 여기에서 보는 것의 종류

그래서 우리는 수첩을 썼다 끝났다 그리고 그 스냅 샷을 볼 수 있습니다 그래서 GitHub 모델과 비슷합니다 당신의 노트를 버틸 수있는 것처럼 따라서 기본적으로 노트는 비공개입니다

그리고 우리는 여기서 일들이 도망가는 것을 볼 수 있습니다 나는이 모든 것들을 하나씩 수행 할 필요가 없었습니다 그리고이 세포들을 수동으로 작동시키지 않으면, 이전에, 내 결과를 얻기 위해 이처럼 위에서 아래로 그 종류의 버그를 잡는 데 도움이됩니다 도움이 될 것입니다 내가 내려올 때 길 아래로 내 공연 이번 주 또는 다음 달에

그리고 노트를 공유하면, 노트를 포크 할 수 있습니다 그들을 포크로 찍을 수 있습니다 당신은 또한 다른 사람들이 당신의 노트를 포크로 찍게 할 수 있습니다, 또한 노트북에 공동 작업자를 추가 할 수 있습니다 동일한 노트에 사용자를 추가 할 수 있습니다 그냥 그들을 포크보다

따라서 많은 훌륭한 공동 작업 모델이 있습니다 Co Lab 및 Kaggle 전체에서 특정 유스 케이스에 그리고 간단히 언급하면 ​​좋을 것 같습니다 Co Lab과 마찬가지로 Kaggle Kernels에서도 GPU를 사용할 수 있습니다 게다가

그래서 그것이 당신을위한 결정적인 요소가되도록하지 마십시오 Kaggle Kernels입니다 슬라이드로 다시 전환합시다 몇 가지 다른 작은 도구와 팁에 대해 이야기 해보십시오 그리고 속임수, 우리가 일을 마무리하기 전에

슬라이드로 다시 전환 할 수 있다면 굉장해 그럼, 당신은 노트북을 원하지 않는다고 가정 해 봅시다 예를 들어, 노트북을 사용해보십시오 그리고 그들은 단지 당신을위한 것이 아니 었습니다 또는 더 큰 작업 부하가 있습니다

장기 실행 작업을해야합니다 몇 시간 동안 뛰게됩니다 아니면 정말 큰 데이터 세트를 가지고 있거나, Kaggle Kernels에 맞지 않습니다 또는 로컬 디렉토리에 맞지 않는 경우, 그래서 수동으로 드라이브에 업로드하지 않을 것입니다 그런 다음 Cloud Machine Learning Engine과 같은 것을 사용할 수 있습니다

당신은 일자리를 차출 할 수 있습니다 – 장기간 일하는 – 분산 된 컴퓨터 집합을 가로 질러 실행될 수도 있습니다 모두 잠재적으로 GPU가 첨부되어 있습니다 일단 끝나면 모델을 제공 할 수 있습니다 당신은 그 예측을하고 싶다 그러나 아마 당신은 그것을 대규모로하고 싶습니다

당신은 앱을 만들고 있습니다 모델을 훈련하고 생성하려고합니다 세계에 예측을 제공 할 수있는 휴식 종점 그리고 기계 학습 엔진 또한 자동 스케일링 예측 서비스가 포함됩니다 글자 그대로 TensorFlow 모델을 사용할 수 있습니다

그것에게 이름을주고, 끝내라 말 그대로 파일을 가리키고 이름을 지정하십시오 다른 단계는 없습니다 왜냐하면 봉사 할 모델을 만드는 관점에서 다른 일은 할 수 없다 그것은 정말로 산뜻하다

그리고 당신이 scikit-learn 같은 것들로 작업한다면 또는 [INAUDIBLE] 부스트를 선택하고 해당 서비스를 제공하려는 경우, 우리는 그것들을 또한 가져갈 것이다 그래서, 당신은 작전을 처리 할 필요가 없습니다 기계 학습의 측면에서, 당신은 당신의 데이터로 놀 수 있고, 모델을 조정하고, 교육하고, 쉽게 배포 할 수 있습니다 그리고 나는 대부분이 대부분은 아니지만 많은 사람들이 기계 학습 API를 알고있을 수도 있습니다

또한 사용할 수 있습니다 이들은 다양한 작업을 수행하기 위해 사전 설정된 API입니다 그들은 좀 더 통조림입니다 자신의 데이터를 제공하지는 않지만 모든 것이 그냥 상자에서 작동한다는 것을 의미합니다 너는 뭔가가 필요해

너는 돌릴 그림이 필요해 설명으로, 당신은 텍스트로 바뀌어야 오디오가 필요합니다, 그냥 작동합니다 그래서 친절 해 그러나 물론 제한 사항은 사용자 정의 할 수 없다는 것입니다 귀하의 특정 사용 사례

아직 기다려야 할 것이 있습니다 조금 더 길어 Vision의 주목할만한 예외가 있습니다 따라서 자동 ML, Vision은 현재 알파에서 사용 가능하며, 그래서 당신은 그것을 신청할 수 있고 자신의 데이터를 제공 할 수 있습니다 자신의 Vision API를 교육하고 맞춤 설정합니다

그래서 그것은 깔끔한 측면 접선과 같습니다 이전에 보았던 애니메이션, 나는 오렌지와 파란 점들과 함께 보여 주었다 TensorFlow 놀이터에서 왔습니다 그래서 신경망으로 놀고 싶다면 귀하의 브라우저에서와 같은 것들을 토글 켜고 끄기 장난 만하면됩니다 TensorFlow

org 그리고 바로 그 일을 할 수 있습니다 그리고 걱정하지 마라, 당신은 그것을 깰 수 없다 브라우저를 통해서만 가능합니다 자신의 기계 만 깰 수 있습니다 그러면 다음은 무엇입니까? 우리가 방금 본 코드는 – 나는 그것을 공개했다

그것은 Kaggle 위에 있습니다 그래서 Kagglecom/yufeng/zoo-demo에 있습니다 TensorFlow에 대해 더 자세히 알고 싶다면, TensorFloworg로 향하십시오

셋째, 기계 학습 과정이 있습니다 구글이 최근에 발표했다 그리고, 만약 당신이 배우고 싶다면 – 정말로 잠수해라 기계 학습의 개념으로, 우리가 오늘 여기에서 이야기했던 것보다 더 멀리 나아 간다 저기로가

기본적으로 전체 커리큘럼이 있습니다 할 수있는 동영상 및 과제에 대해 기계 학습 지식을 축적하십시오 그리고 마지막으로, 기계를 다루는 데 관심이 있다면 클라우드에서 학습하면 넘어갈 수 있습니다 클라우드 돔, 하얀 텐트에 Google Assistant 돔 옆에 있습니다 또는 cloud over

Googlecom/mineinelearning으로 이동하십시오 또는 / ml이다 처음에 언급했듯이, 저는 비디오 시리즈를 호스트합니다 AI 모험과 같은 이름으로 우리는 재미있는 너겟을 탐험한다

기계 학습에 관한 각 에피소드에서, 한 번만 실습 데모를 시도해보십시오 흥미로운 사람들과 몇 차례 인터뷰를합니다 그래서 잘하면 당신은 그것을 확인하고 구독 할 것입니다 이 세션에서 저와 함께 해 주신데 대해 감사드립니다 우리는 정말로 – 세션에서 피드백을 정말 고맙게 생각합니다

정보, 그래서 일정에 이상 머리에하시기 바랍니다, 로그인하여 몇 가지 피드백을 줄 수 있습니다 고마워 [박수 갈채] [음악 재생]

The future of Voice and AI? Are you going to be disrupted?

나는 많은 사람들이 그렇게 생각하지 않는다 음성 왜건에

나는 목소리가 커질 것을 의미합니다 Google의 경우 교통량의 50 % 그들은 문자 그대로 문자 그대로 자신을 교란시킵니다 누군가가 스스로를 혼란에 빠뜨리면 다른 모든 산업과 마찬가지로 붕괴 될 것입니다 기본 웹 사이트 더 이상 웹 사이트가 될 수 없습니다 그것은 될 것입니다

내부에서 말하는 봇 또는 AI BOT 알렉사 또는 내부 Google 직접, Google 홈 플랫폼 등 그래서 나는 단지 그 상상 세계는 변화하고있다 실제로 바뀌지 않는 녀석들 시간이 영향을받을 수 있습니다 우리가 말하는 거대한 회사들 약처럼 당신의 소규모 공급자 큰 소매상 인에 대하여 생각하십시오 이러한 웹 사이트는 파괴적 일 것입니다 2 4 2 ~ 5 백만을 보냈다

갑자기 그 것으로 바뀌었다 정말로 조교가있다 그것이 우리가 찾고있는 것입니다 이것은 마치 보이는 것입니다 거기에서부터 시작됩니다

구매 페이지 만 있으면됩니다 전부 전체 웹 사이트를 건너 뜁니다 경험이 너무 중요하다 그 기술은 정말로 quikcly 변화하고 있습니다

실제로 저장할 비용은 적습니다 모든 음성 정보보다 정보 특정 그것을 바로하는 플랫폼 따라서 실제로 끝내기가 쉽습니다 그 애가 그 거리에서 프로그램 할 수있어 인공 지능 로봇 당신이 할 수있는 Facebook 등 세상이 바뀌고 있습니다

그 흥미 진진한 Good ole voice, 좋은 오래된 목소리 야 그것이 될 것입니다 미래

Opportunities, challenges, and strategies to develop AI for everyone (Google I/O ’18)

[음악 재생] 페르난다 비 에츠 : 와줘서 고마워 제 이름은 페르난다 비에 가스입니다

나는 Google Brain의 일부입니다 저는 또한 PAIR 이니셔티브의 리더이기도합니다 People + AI Research를 위해 오늘 가입하게되어 매우 기쁩니다 이 멋진 패널

그래서 저는 Rajen Sheth입니다 그는 제품 담당 이사입니다 Google Cloud AI, Daphne Luong, 구글의 엔지니어링 디렉터, 존 플래트 (John Platt) Google AI에서 응용 과학 담당 이사 그리고 오늘, 우리는 기회에 대해 이야기 할 것입니다 도전 과제 및 전략을 개발했습니다

네가 할 수 있다면, 제발, 나는 너를 사랑해 Google에서하는 일에 대해 간단히 이야기하겠습니다 RAJEN SHETH : 제 이름은 Rajen Sheth입니다 클라우드 AI 용 제품 팀을 운영하고 있습니다 따라서 우리가하는 일은 Google 클라우드 내에 있습니다

우리는 어떻게 AI의 최고를 가져올 수 있는지 알아 내려고 노력하고 있습니다 개발자와 기업에게 그렇다면 개발자에게 구축 할 수있는 훌륭한 플랫폼을 제공하려면 어떻게해야할까요? 그렇다면 Google의 최고의 AI를 어떻게 활용할 수 있습니까? 서비스로 사용할 수 있도록 개발자를위한? 페르난다 비 에츠 : 고마워 DAPHNE LUONG : 제 이름은 다프네 루옹입니다 저는 Google AI, 인간의 계산, 데이터, 자연 언어 이해

John Platt : 저는 존 플랫입니다 그리고 적용된 과학 기관을 운영하는 데 도움이됩니다 Google AI 내부 우리는 모든 기회에 매우 흥분합니다 생물학이나 물리학과 관련된 과학 그리고 우리는 컴퓨터 과학, 특히 기계 학습과 인공 지능, 정말 가속화 할 수 있습니다

이것이 바로 우리 조직이하는 일입니다 페르난다 비 에츠 : 고마워 그래서 매우 사물 중 하나 이 패널과 많은 주제에 대해 저에게 영감을줍니다 올해 I / O에서 진행되는 모든 사람들을위한 AI입니다 그래서 저는 PAIR에서 주요 연구 중 하나 인 것을 알고 있습니다

우리가 가진 주제는 인간 중심의 AI를 어떻게 디자인 할 것인가입니다 과학 기술? 사용자를 염두에두고 어떻게 시작합니까? 그 다음에 맞는 기계 학습 기술을 설계 할 것인가? 그래서 내가 당신 한테 물어보고 싶은 것들 중 하나 조금이라도 이야기하는 것은 "모든 사람들을위한 AI" 너에게 의미가 있니? RAJEN SHETH : 나에게 그것은, 정말로, AI를 어떻게 쉽고 유용하게 만드십니까? 그것을 사용하고 싶은 사람들을 위해? 그리고 저는 우리에게 두 가지 큰 문제가 있다고 생각합니다 지금 AI로보고 있습니다 하나는 그곳에는 많은 기술이 없다는 것과 그렇지 않은 것입니다 AI 모델을 구축하는 방법에 대한 지식, 특히 깊은 학습, 거기 있어야합니다

그래서 우리는 그것들을위한 도구를 만들려고 노력하고 있습니다 더 많은 사람들이 AI에 액세스 할 수 있도록하기 위해, 하지만 AI에 대해 배우고 그것을 어떻게 사용하는지 파악할 수 있습니다 예를 들어 우리가 찾는 것은 아마 수만 명에 달할 것이라고 깊은 학습을하는 법을 알고있는 사람들의 아마 2 억 정도의 순서로 밖에있는 데이터 과학자들 그러나 2,100 만 명의 개발자가 있습니다 그래서 우리의 목표는 AI를 어떻게 얻는가입니다

2100 만 명의 개발자가 액세스 할 수 있습니까? 그리고 두 번째 부분은 유용성입니다 AI가 유용하도록 실제로 어떻게 만들었습니까? 우리는 어떻게해야합니까? 특히 기업, 멋진 일만 할 수없는 곳을 넘어, 그러나 그들은 유용한 일을 할 수 있으며, 실제로 비즈니스에 필수적입니까? 페르난다 비 에츠 : 당연하지 DAPHNE LUONG : 나에게, 모두가 참여하고 인식하게하기 그래서 알고리즘은 표현을 가진다 모든 사용자에게 제공됩니다

데이터 측면에서 이것은 우리가 대표적인 데이터가 있어야한다 모든 사용자의 네 글쎄, 나를 위해, 모두를위한 AI가 노력하고있다 사회의 많은 부분에 인공 지능의 혜택을 얻으려고 또는 전 세계에 걸쳐 그래서 우리는 레버리지 포인트를 찾습니다 우리는 세계의 모든 사람들이 인공 지능을 사용하도록하려는 것이 아닙니다

우리는 AI가 제공 할 수있는 것들의 열매를 맺기 위해 노력하고 있습니다 그래서 우리가 이러한 지렛대 포인트를 발견 할 수 있다면, AI의 로컬 응용 프로그램은 정말 전 세계를 도울 수 있습니다 그것이 우리가 찾고있는 것입니다 그래서 나는 슈퍼 영웅입니다 인공 지능과 기계 학습 문제 과학, 과학은 획기적인 기술로 이어질 수 있기 때문입니다

페르난다 비 에고 : 좋아요 나는 여기 흥미로운 것들 중 하나를 생각한다 이 패널과이 주제는 각자가 매우 다른 관점에서오고있다 Rajen, 제품에 관해서 생각하고 있습니다 사물의 비즈니스 측면을 슬래시

대프니, 근본적인 블록 중 일부를 만드는 것을 돕고 있습니다 데이터와 마찬가지로 기본적인 데이터 생성 이 기술을 전혀 할 수있는 블록 그리고 나서 John, 당신은 연구의 관점에서 왔습니다 우리는 어떻게 과학자들을 가능하게할까요? 어떻게 과학을 가능하게 할 수 있습니까? 우리가 인공 지능에 관해 이야기 할 때마다 올 수있는 것들 중 하나입니다 우리가 기계 학습에 관해 말할 때마다, 이 표현의 개념입니다

그리고 저는 그것으로 처음부터 시작하고 싶습니다 데이터에 대해 이야기하고 싶습니다 대프니, 정말 흥분 했어 네가이 패널의 일부가 될 거라는 말을 들었을 때 왜냐하면 나는 당신을 구글의 데이터 황제라고 생각하기 때문입니다

[LAUGHS] 그래서 당신의 작품은 더 좋은 방법을 창조하는 것에 관한 것입니다 규모를 키울 수 있습니다 예를 들어 데이터를 어떻게 수집합니까? 우리는 어떻게 통찰력있는 방법으로 그렇게합니까? 그래서 제가 좋아할만한 것들 중 하나 너에 대해서 조금이라도 말하면 Google에서 데이터 세트를 표현한 것입니다 오늘 그게 어떻게 생겼어? 그래 따라서 의미 론적으로 의미 있고 체계적인 – 정확하게 교정 된 라벨 데이터, 규모는 기계 학습에 정말로 중요합니다

표현의 관점에서 볼 때 일부 데이터 잘 균형이 잡히지 않았다 예를 들어, 위키 피 디아 데이터를 살펴보면, "그"라는 대명사는 훨씬 더 많이 언급됩니다 "그녀보다" Google 내부에는 많은 데이터가 있습니다 그리고 내가 이야기하고 싶은 예제 세트 작년에 우리가 오픈 한 오디오 데이터 세트입니다

데이터 세트에는 85k 시간의 오디오가 포함 된 210 만 개의 비디오가 있습니다 그런 다음 약 500 클래스의 사운드로 주석을 달았습니다 그건 꽤 흥미 롭군요, 그렇죠? 너는 연설과 음악, 모든 방법으로 소리를 낸다 엔진 소리 또는 burping 또는 양치질에

그런 관점에서 보면 오디오와 사운드를 갖는 것이 정말로 중요합니다 세상의 모든 사람들이 아이들의 소리를 듣는 것과 같습니다 인도는 중국과 미국과 매우 다릅니다 그런 종류의 것이 내가 생각하는 것입니다 데이터 세트를 만들 때마다 생각해야합니다

페르난다 비에 가스 : 그래서 훌륭합니다 그래, 내가 다른 모든 오픈 소스 데이터를 알게되었을 때 우리가 내놓은 세트는 정말 흥미 롭습니다 오디오, 비디오, 텍스트를 볼 수 있습니다 번역이 있습니다 너는 그것들 모두를 가지고있다

그러나 기계 학습에서 데이터에 대해 이야기 할 때마다 당신은 또한 도전에 대해서 이야기하고 있습니다 그래서 네가 조금 만지기 시작한 것들 중 하나가 나는 그것을 더 끌어 내고 싶다

표현의 개념이다 데이터 세트가 올바른 표현인지 확인 다른 사용자, 다른 지역 사회 그리고 그것은 어려운 일입니다 궁금 해서요, Google이 그 일에 대해 무엇을하고 있습니까? 어떻게 생각하고 있니? 네 커뮤니티의 Google 사용자이므로 매우 기질이 좋았고, 우리를 위해 데이터와 물건을 기부했습니다

우리 제품을 더 잘 만들 수 있습니다 Google 가이드가 그 예입니다 얼마나 많은 사용자가 Google 가이드를 잠재 고객에게 사용 했습니까? 그래, 네 그래서 데이터면에서 우리는 정말 비슷한 것을하고 있습니다 우리는 애플 리케이션과 웹상에있는 Crowdsource 앱을 가지고 있습니다

바로 지금, 지난 2 년 이래로, 실제로 2 백만 명의 사용자가있었습니다 전 세계의 앱에 기부, 사실 233 개국 그것은 많은 다른 사람들입니다 그리고 우리는 사람들로부터 2 억 건의 기부금을 받았습니다 질문, 모든 방법에서, 헤이, 인도네시아의 한 도시에서이 표지판을 길에서 볼 수 있습니까? 대,이 문장을 어떻게 사용합니까? 힌디어에서 문장의 정서는 무엇입니까? 모든 데이터가 있습니다

그리고 그 데이터는 실제로 제품을 더 좋게 만드는 데 도움이됩니다 사람들이 표지판이없는 거리를 탐색 할 수있게 도와줍니다 랜드 마크 탐색과 마찬가지로 키보드를 더 많이 사용합니다 접근성이 좋고 무거운 물건 만들기 [불충분] 세부 사항 레이블이 지정된 데이터 세트 그래서 저는 그것이 정말로 중요하다고 생각합니다

Crowdsource 앱이 없다면, 그것을 다운로드하십시오 페르난다 비 에고 : 좋아요 고맙습니다 내가 결코 해본 적이없는 오디오에 관한 것들 중 하나 내가 이것을 읽을 때까지 생각했다 성인의 목소리 사이에 큰 불일치 어린이 대

그래서 당신은 많은 다양한 차원들에 대해 생각해야합니다 다양성 그래 그리고 앱에서 우리는 실제로 35 개국에 사용자가 시작한 그룹이 있습니다 우리는 사실 모든 기여에 대해 정말로 흥분하고 있습니다

페르난다 비에 가스 : 굉장해 승인 자 이제 데이터에서 조금 이동하십시오 우리가 모든 사람들에게 AI에 관해 말할 때마다, 나는 생각합니다 마음에 오는 첫 번째 질문 우리가 어떻게 AI를 이용 가능하게하고 사용자를 위해 더 좋게 만드는가? 라잔, 여기 내가 너에게로 향할거야

그리고 당신이 클라우드에서 이러한 서비스를 이끌도록 돕고 있기 때문에, 이 ML 도구를 어떻게 설계 할 생각입니까? 사용자가 쉽게 사용할 수 있습니까? 그리고 거기에 또 하나의 질문이 있습니다 어려움에 대해 조금이라도 이야기 할 수 있다면 네가보기 시작 했어 사용자가 고착되는 패턴은 무엇입니까? RAJEN SHETH : 예, 예 좋은 질문입니다 나는 그것의 두 가지 큰 부분이 있다고 생각합니다

하나는 사람들이 모델을 쉽게 만들 수 있도록하는 것입니다 그러나 두 번째 부분은 어떻게 확신 할 수 있는가입니다 그 모델이 공정하고 편견이 없으며 실제로 게재되고 있습니다 그 목적은 옳은가? 사람들에게 매우 쉽기 때문에 그들이 수동으로하고있는 것을 취하고 결국 끝내기 위해, 인코딩 바이어스 그래서 그것의 한 부분에서 우리가하는 일은 우리는 다양한 도구를 제공하고 있습니다

우리가 작업하고있는 가장 흥미로운 것들 중 하나 Cloud AutoML입니다 따라서 Cloud AutoML은 사용자가 우리에게 줄 수있는 방법입니다 데이터 세트를 만든 다음 기계를 사용합니다 그 데이터를위한 기계 학습 모델을 만드는 법을 배웁니다 세트

우리가이 일을하는 첫 번째 영역 당신이 우리에게 줄 수있는 이미지 인식입니다 레이블이 지정된 일련의 이미지가 표시되면 매우 정확한 모델을 맨 위에 놓으십시오 이미지를 예측할 수 있습니다 그래서 이것이 그 사실을 확장시키는 데 도움이되었습니다 우리는 그것에 접근하기 위해 등록한 15,000 명의 사람들이 있습니다

그리고 우리는 놀라운 사용 사례를보고 있습니다 정말 큰 회사에서 아주 작은 회사에 이르기까지 주위에 일을하고 있습니다 예를 들어, 농민들이 밭을 관리하거나 쓰레기를 추적하는 것을 돕는다 생산자에게 쓰레기를 되돌려 주도록하십시오 페르난다 비에 가스 : 기술적 전문성 AutoML을 사용하려면 사용자로서 필요합니까? RAJEN SHETH : 네, 좋은 질문입니다

우리는 그것을 만들기 위해 방향을 잡으려고합니다 ML이 제한적이거나 필요하지 않도록해야합니다 그것을 사용할 수있는 전문 지식 그리고 우리 UI를 보면, 그것은 매우 유사합니다 Google 포토

사진을 업로드합니다 라벨을 붙이세요 실제로 다프네 (Daphne)와 많은 서비스를 통합하고 있습니다 팀이 원한다면 우리에게 라벨을 붙이기 위해 사용하고 있습니다 그리고 당신은 기차에 탔고, 그러면 우리는 당신을위한 모델을 만드십시오

그러나 올바른 데이터를 얻는 것은 세트가 핵심 부분입니다 따라서 모델을 만들 필요가없는 경우에도, 올바른 데이터 세트를 만들어야합니다 그리고 거기에서, 우리는 확실한 도구를 제공하려고 노력하고 있습니다 사람들은 올바른 데이터 세트를 만들 수 있습니다 데이터 세트에 결함이있는 곳을 찾아냅니다

그리고 나서 이것의 반대편에서 편견과 같은 것들, 우리는 그 주변의 도구를 알아 내려고 노력하고 있습니다 모범 사례를 통해 고객에게 조언을 제공합니다 그들이 넣는 데이터 세트가 실제로 올바른 결과를 얻을 수 있습니다 페르난다 비에 : 괜찮아 데이터가 계속 병목 현상의 하나가되고 있습니다

RAJEN SHETH : 이것이이 기초입니다 그리고 잘못된 데이터를 넣으면 결국 잘못된 결과와 함께 페르난다 비 에츠 : 네 승인 존, 주제의, 모두가보고있는 것처럼, 데이터 집합의 다양성 – 다양성 또한 이러한 경험을 어떻게 작성합니까? 컴퓨터 학습 자체가 아닌 사용자를 위해 전문가,이 기술을 사용할 수 있습니까? 나는 또한 당신에게 다양성에 대해 듣기를 좋아합니다

기계 학습 측면의 표현, 개발자 연구원 내가 너를보고있는 이유는 네가 과학자들과 일하고있다 그래서 잠재적으로 필요로하는 사람들입니다 맞춤형 모델 그들은 때로는 봉투를 밀고있을 것입니다

그러나 그들은 기계 학습 전문가가 될 수 없습니다 그래서 나는 당신의 생각에 대해 궁금합니다 존 플래트 : 글쎄, 과학은 점점 커지고있다 점점 더 데이터 중심으로 발전 할 것입니다 물리학자를 비롯한 많은 과학자, 생물 학자들에게 지질 학자들, 그들은 일을한다

많은 양의 데이터를 수집합니다 그래서 그들은 이미 데이터 과학에 종사하고 있습니다 그리고 지금 큰 기회가 있습니다 그들 스스로가 훨씬 더 많은 것을 배우기 위해 기계 학습을 사용하도록 생산적인 내가 보는 방식은 친절 하네

과학자에게 수천을주는 것 같이 학부 보조자의, 즉, 볼 일, 슬라이드 – 당신이 세포의 슬라이드를 검사 할 수 있다면, 당신은 수천 명의 보조원이 당신을 위해 그것을 볼 수 있습니다 그것은 일종의 예입니다 그래서 이것이 당신의 질문에 답하는 지 모르겠습니다 그러나 나는 우리가 할 수있는 것에 정말로 흥분한다 과학자들이 도움을 줄 수있는 구체적인 방법을 도울 수있는 모델을 만든다

그들의 연구를 가속화합니다 그리고 우리는 실제로 과학자들과 협력합니다 이러한 종류의 모델을 구축하는 데 도움이됩니다 그래서 나는 당신의 질문에 대답하기를 바랍니다 페르난다 비 에츠 : 어떤 종류의 과학자들인가요? 너 같이 일하고있어? John PLATT : 음, 적용된 과학 사람들, 생물 의학 연구를 시도하는 우리 무리가 있습니다

질병의 핵심 연구를 이해한다 신경 퇴행성 질환과 같은 기후와 에너지를 연구하는 우리 무리가 있습니다 그래서 우리는 TAE Technologies라는 회사와 일하고 있습니다 우리가 융합 에너지를 만들 수 있는지 알아 내려면 상업적으로 적합하게 만드십시오 그래서 우리는 생물학, 물리학, 화학 전반에 걸쳐 있습니다

우리는 양자 화학을 모방하는 많은 사람들과 협력합니다 페르난다 비에 가스 : 그리고 나는 같은 질문을 짐작한다 나는 Rajen에게 물었다 나는 너에게 묻고 싶다 그게 가장 큰 것 같아

오늘날 과학자들이 이런 종류의 일을하기가 어렵다 패턴이 있습니까? 데이터입니까? 모델을 조합하는 방법을 이해하고 있습니까? 너 뭐가 보이니? John PLATT : 글쎄, 그들은 일반적으로 모델 중 일부는 만들지 만 모델 자체를 만들고 싶습니다 과학자와 컴퓨터 사이에 증가하는 교차가 있습니다 과학자 그러나 나는 그들이 생산성 도구를 갖고 싶어한다고 생각합니다 즉, 생산성 도구를 구축 할 수 있도록 도와 줄 수 있습니까? 그들 자신의 연구를 위해서? 그리고 그들은 스스로 그것을 만들려고 노력할 수도 있습니다

그들이 기계 학습을 알고 있거나 우리가 그들을 도울 수 있다면 페르난다 비에 : 괜찮아 그래서 그 라인을 따라, 물건 중 하나 나는 아주 흥분했다 몇 달 전, PAIR의 사람들, Google의 다른 사람들과 협력하여 TensorFlowjs를 시작했습니다

그리고 이것은 정말로 중요합니다 우리가 말한 것에 관해서는 기술을 민주화하고 기계 학습 웹 TensorFlowjs는 웹의 모국어를 구사하며, 자바 스크립트를 말한다 그리고 지금은 완전히 새로운 세트를 가지고 있습니다

~을 시작할 수있는 개발자의 이 기술의 이점 그리고 우리는 이미보기 시작했습니다 몇 가지 흥미로운 응용 프로그램 예를 들어, 마우스를 만들기 위해 자신의 웹 카메라를 기반으로 모델을 훈련시키는 것 그가보고있는 곳에서 다른 방향으로 이동하십시오 그래서 그가 위로 쳐다 보면 마우스가 올라갈 것입니다

그가 내려다 본다면, 마우스가 내려갈 것입니다 그가 그렇게 한 이유는 그가 시도했기 때문이었습니다 뇌졸중을 앓 았던 친구를 돕기 위해 하반신 마비가되었습니다 그래서 저에게 다시 말하기 시작합니다 데려 갈 수있는 가능성에 대해 이 기술을 개인적으로 – 무엇이 필요합니까? 특정 목적을 위해이 모델을 어떻게 훈련시킬 수 있습니까? 우리가 기술의 민주화에 관해 이야기 할 때, 우리가 그것을 모두에게 가져 오는 것에 대해 이야기 할 때, 내가 Google에서 생각하는 것 중 하나 우리가 통찰력을 가지고 그렇게해야한다는 것을 매우 염두에 두었습니다

책임감 당신은 앞으로 생각하고 싶다 그래서 내가 가진 한 가지 질문, Rajen입니다 이 서비스를 제공하기 때문에 나쁜 행위자가 당신의 서비스를 사용하려고한다면 어떻게됩니까? 그리고 어떤 안전 장치를 제공 할 수 있습니까? RAJEN SHETH : 네 그게 큰 질문입니다

그것은 우리를위한 마음의 맨 위에 있습니다 더 많은 사람들이 AI를 사용하는 것을 보았을 때, 우리는 우리가 이러한 안전 장치를 제공하고 있는지, 안전 장치인지 모범 사례 이건간에 올바른 방법으로 사용되는지 확인하십시오 한편으로는 오픈 소스와 같은 것들이있을 때 기술, 사람들을 막는 것은 매우 어렵습니다 그들이 나쁜 일을하고 싶다면 나쁜 일을하는 것 그러나 우리가 구름으로 얻게되는 이점 중 하나는 우리가 할 수있는 것입니다

우리는 서비스 또는 수용 가능한 사용 정책의 관점에서, 사람들을 확신시키는 그런 것들 이것을 올바른 방법으로 사용하고 있습니다 우리가 AI로 발견 한 것 중 하나는 우리가 그것을 재고해야한다는 것입니다 더 이상 인프라 기술이 아닙니다 우리는 그 사용법을 다시 생각해야한다 그리고 그것은 우리가 꽤하고있는 것입니다

나를 걱정하는 또 다른 일 나쁜 배우들, 사람들 무의식적으로 나쁜 일을하는 것 그들이 있다는 것을 알지도 못합니다 그리고 그것은 어떤 것들로 돌아갑니다 우리는 편향과 공정성에 대해 이야기했습니다 많은 경우 사람들은 의도하지 않습니다 편향된 것을 만들려면 그러나 그들은 결국 무언가를 창조하게됩니다

그것은 들어오는 데이터로 인해 편향되어 있습니다 그게 우리가하는 또 다른 영역입니다 꽤 많이 보았습니다 이것이 우리가 사람들을 도울 수있는 방법입니다 고객, 개발자, 이 작업을 수행 할 수있는 도구는 의도하지 않게 나쁜 모델을 생성하지 않습니까? DAPHNE LUONG : 금형 제작과 함께, 나는 사람들에게 모든 것을 훈련시키는 것도 중요하다고 생각한다

처음부터 끝까지, 끝에서 끝까지, 데이터, 다양성, 데이터에 필요한 요소 우리는 실제로 심지어 annotator를 훈련시키고, 그래서 그들은 모든 경로를 따라 다양성을 가지고 있음을 알고 있습니다 그래서 저는 그것이 중요하다고 생각합니다 다른 실무자가 이해할 수 있도록 최고의 데이터, 기계 학습을위한 모범 사례 페르난다 비 에츠 : 당연하지

JOHN PLATT : 나는 보통, 나는 생각한다 연구 관점에서 이것에 대해 왜냐하면 나는 연구원이기 때문이다 그리고 우리는 논문을 쓰고 출판합니다 우리는 매우 신중하게 생각해야합니다 우리가 종이를 쓸 때

내 말은, 의도는 세계에 긍정적 인 영향을 미친다는 것입니다 그래서 우리가 논문을 발표하기 전에, 이것이 세계에 긍정적 영향을 미칠 것인가 아닌가? 자, 항상 예측할 수는 없습니다 의도하지 않은 결과가 발생할 것입니다 기술 공개 그러나 우리는 최선을 다하려고 노력합니다

그리고 우리는 일반적으로 개방성에 편향되어 있습니다 그것은 단지 일반적이기 때문에, 우선 순위 이러한 기술을 공유하는 것이 더 좋습니다 페르난다 비 에츠 : 네 나는 스스로 연구원으로 말해야한다 나는 출판과 열린 소싱의 정신을 좋아합니다

그리고 나는 이런 분야에가 본 적이 없다 전에 전체 아이디어를 게시하는 곳 당신이 발견 한대로 그런 다음 회의에 제출합니다 나는 전에 그것을 본 적이 없었다 그리고 그것은 그것이 훌륭하다고 생각합니다

필드가 훨씬 빠르게 진행됨을 의미합니다 나는 우리가 이야기하고 있던 한 지점으로 돌아가고 싶다 이 생각이 거기 있을지도 모른다 의도하지 않은 결과가 될 수있다 또는 최선의 의도로도, 데이터가 편향된 것을 알지 못할 수도 있습니다

또는 비뚤어 지거나 뭔가있을 수 있습니다 그리고 거기에 나가고 싶은 한 가지 생각은 사람들이 데이터를 검사 할 수 있도록 도구를 작성하고, 또한 사람들의 공동체를 개방한다 이 물건들을 검사하는 사람 예를 들어, PAIR에서 우리가 한 일 중 하나는 건물 도구, 시각화 도구, 전체 데이터 세트를 시각화하여 너는 아주 쉽게 물건들을 볼 수있어 오, 이거

내 데이터의 모양입니다 이것은 배포판입니다 이것은 여성 데이터 포인트 또는 남성 데이터의 모습입니다 포인트 또는 하위 데이터 포인트 이것이 의미하는 바는 이 사용자 인터페이스는 경험, 시각화, 그것은 개발자가 이것을 볼 수있을뿐만 아니라 의미합니다

즉, 제품 관리자가이를 볼 수 있음을 의미합니다 임원, 누구나– 서로 다른 이해 관계자가 대화를 시작할 수 있습니다 같이 앉아서, 오, 나도 몰라 나는 데이터 세트에서 이상한 것을 보았다 아니면 당신이 생각할 때 우리는 어떻게 될 것이라고 생각합니까? 여기에이 차원의 패싯? 그래서 나는 너의 생각을 조금 듣고 싶다

주변에서 대화를 넓혀야하는 중요성에 대해 모두를위한 인공 지능은 대화가 아니기 때문에 개발자들 사이에서만 일어나고 있습니다 분명히 개발자는 매우 중요합니다 그러나 나는 또한 그것이 대화라고 생각한다 보다 폭 넓은 이해 관계자가 필요합니다 RAJEN SHETH : 저도 그렇게 생각했습니다

그리고 너 재미있어 이전 대화에서 이것이 얼마나 빨리 진행되고 있는지 이야기합니다 일반적으로 고객에게 내 프레젠테이션을 시작하는 한 가지 방법 첫번째 슬라이드입니다, 저는 모자이크 브라우저의 그림을 보여줍니다 1994 년 그리고 저의 요점은 우리 모두, 우리는 그것이 무엇인지 기억하십시오

그리고 그 시점 이전에, 인터넷 그 시점 이전에 매우 오랜 시간 동안 주변에 있었다 하지만 인터넷이 시작된 때였습니다 더 많은 것을 위해 더 많은 사람들에게 나가기 스포츠 점수를 확인하는 것에서부터 모든 것을 보았습니다 전자 상거래, 모든 종류의 것들

그리고 더 많은 가능성을 열었습니다 그리고 더 많은 질문을 열었습니다 페르난다 비 에츠 : 네 RAJEN SHETH : 그리고 또한 질문합니다 더 많은 도구와 도구가 필요해졌습니다

사람들을 안전하게 만드는 도구 그리고 나는 우리가 1994 년에 있다고 생각한다 우리는 지금 AI를위한 그 시점에 있습니다 그것은 수년간 그리고 수년간 사용되어 왔습니다 그러나 지금, 그것은 사용되고 있고 많은, 더 많은 방법

그래서 우리는 그런 식으로 금형에 대해 생각할 필요가 있다고 생각합니다 매일 새로운 문제가 생기기 시작합니다 그리고 매일 새로운 기술들이 나오고 있습니다 그래서 우리는 그것에 대해서 생각할 필요가있을 것입니다 개발자 커뮤니티로서 그것이 사용되는 방법과 사람들과 조화를 이루어 그것은 영향을 미치고 있습니다

존 플래트 : Rajen과 나는 단지 첫 번째 스팸 탐지기에 대해 이야기하기 우리가 1997 년에 오기 전에 나는 80 년대에 보낸 첫 번째 스팸 전자 메일을 기억합니다 새로운 문제가 생기면 문제를 해결하는 데 도움이되는 새로운 도구가 필요합니다 RAJEN SHETH : 그것은 좋은 지적입니다, 오랫동안 당신은 스팸 탐지기를 필요로하지 않았습니다 그리고 갑자기 모든 것이 일어났습니다

그리고 나서 그 도구로 작업 할 수 있어야합니다 페르난다 비에 가스 : 또 다른 측면, 또 다른 측면 대화의 폭을 넓히고, 특히 제품에 대해서도 이야기 할 때, 같은 방에 있다는 개념입니다 기술 팀, 설계 팀, 예를 들어, 그리고 당신의 PMs 등등 Google에서하는 일 중 하나가 디자이너, UXers를 참여시키는 방법을 찾고있다 처음부터 컴퓨터를 중심으로 교육 디자인 자료로 학습

문자 그대로, 어떻게 생각하십니까? 디자인 할 소재? 그리고 그것에 대해 생각한다면 그것은 매우 도전적인 자료입니다 제품의 각 사람이 약간 다른 사용자 경험이있을 수 있습니다 내 경험은 당신과 매우 다를 수 있습니다 어떤 것들은 다른 방법으로 자동화 될 수 있습니다 다른 시간에 다른 사람들을 위해

그리고 그것은 그 UX, 사용자 상호 작용, 훨씬 더 도전적입니다 그 공간은 훨씬 커집니다 그리고 다시, 우리가 모든 사람들을위한 인공 지능에 대해 이야기 할 때, 정말이 대화를 의미합니다 여러 당사자간에 발생해야합니다 우리가 다 떨어지기 전에 돌아와야 할 한가지 시간, 존,이 과학의 개념입니다

내가 생각하기에 흥미로운 점 중 하나는 주변은 기계 학습이 과학자들을위한 새로운 패러다임이 되라 마침내 우리는 확실하게 해결할 수있었습니다 이러한 새로운 도구를 사용하여 복잡한 과학적 문제 그래서 나는 왜 당신의 생각이 궁금하니? 이 인공 지능은 매우 복잡한 공간에서 그러한 차이를 만듭니다 John PLATT : 글쎄, 그것은 훌륭한 질문입니다

현재 AI 및 기계 학습의 현재 상태 여전히 매우 지각 적이다 우리는 이미지를보고 소리를 듣는 데 아주 능숙합니다 그리고 제가 전에 말했듯이 여러분은 상상할 수 있습니다 저는 수천 명의 학부생에 대해 이야기하고 싶습니다 그들은 데이터를 듣거나 볼 것입니다

그리고 이것은 과학에 대한 훌륭한 생산성 용어입니다 장기적으로는– 사람들은 이것에 대해 연구하기 시작했습니다 그러나 장기적으로 볼 때 우리가 정말로 인과 관계 모델 (causal model) 기계 학습 또는 인공 지능 알고리즘이 실제로 시도하는 곳 무엇이 무엇을 일으켰는지 이해합니다 제 말은 아직 연구 초기에 매우 초창기입니다 하지만 그것은 거의 과학의 핵심입니다

과학적 모델은 이것을 일으킨 원인을 설명합니다 그리고 당신이 인과 관계 모델이 무엇인지 안다면 당신은 추정 할 수 있습니다 그래서 저는 이것이 AI의 장기적인 추세라고 생각합니다 그러나 우리 모델은 실제로 그렇게하지 않기 때문에 아직 존재하지 않습니다 인과 관계를 아직 이해하지 못한다

페르난다 비에 가스 : 그래서 그 라인을 따라 것들 중 하나, 우리는 캠브리지에있는 우리 그룹의 객원 과학자가있었습니다 그는 지진 과학에있어 너 내가 누군지 알지 하버드 대 교수입니다 우리와 함께 1 년 반을 보냈습니다

그리고 내가 생각했던 것들 중 하나는 엄청나게 그가하고있는 일에 영감을 불어 넣었습니다 지진 과학자로서 지진을 예측하고 싶습니다 엄청나게 어렵습니다 우리는 아직 잘 할 수 없다 하지만 그가 할 수 있었던 일은

그래서 나는 지진 과학에 대해 아무것도 몰랐다 그는 이것이 나에게 과학의 종류라고 설명했다 HPC, 고성능 컴퓨팅에 살고 있습니다

거대하고 거대한 컴퓨터로 전체 주를 보낼 것입니다 매우 거칠게 계산을하고, 여진이 어디에서 일어날 지 시뮬레이션한다 지진 후에 일어난 일 캘리포니아 주민들은 네가 할거라고 확신 해 일주일이 걸리는 것을 상상해보십시오 거대한 컴퓨터에서

그는 이러한 종류의 시뮬레이션 결과를 얻을 수있었습니다 그것은 단순한 신경망을 사용하는 것만 큼 좋았습니다 너무 단순 해 신경망은 아주 간단했습니다 그것은 신경망의 종류였습니다 뉴런을 셀 수있는 곳

그것이 얼마나 간단한 지입니다 그리고 하나, 그는 기절하고 엄청나게 행복했습니다 그가 일주일 내내 기다릴 필요가 없다는 의미로 동일한 종류의 컴퓨팅 능력을 사용하여 그가하고 있었던 시뮬레이션 그래서 그 자체로 승리했습니다 그러나 더 깊은 질문과 그 중 하나 그건 나에게 많은 흥분을 안긴다

이 신경망이 정확히 무엇인지 알아내는 것입니다 우리가 알아 내지 못한 지구 물리학에 대해 아직? 그리고 우리가이 시스템이하는 일을 해석 할 수 있다면, 이 신경망이 무엇을하고 있었는지, 우리가 그것으로부터 배울 수 있다면, 우리는 더 나은 과학자가 될 수 있을까요? 그리고 과학에서 이것을보기 시작합니다 의학에서 이것을보기 시작했습니다 예를 들어, 당뇨병 성 망막증과 함께 작용하는 뇌, 이 시스템들이 등의 이미지를보고있는 곳 너의 안저, 너의 안저 그리고 그들이 이해할 수있을뿐만 아니라 당신은 당뇨병 성 망막증이 있습니다

그러나 그들은 또한 일을 할 수 있습니다 환자의 성별을 이해하는 것 심혈관 질환 위험, 사물 의사들은 반드시 그럴 필요는 없다 이 이미지들을 보라 그래서 다시, 경주의 일부는 이 시스템이 무엇인지를 이해하는 것 우리가 배울 수 없었던 것? 그래서 우리는 더 나은 의사, 더 나은 과학자가 될 수 있을까요? 이것을 사용하여? 우리가 다시 배울 수 있을까요? 우리는이 기계들로부터 귀 기울일 수 있습니까? 그래서 우리는 몇 분 남았습니다 하지만 두 가지 더 질문이 있습니다

하나는 당신을위한 것입니다, Rajen 당신은 AI의 능력에 대해 무엇을 보았습니까? 정말 기업을 돕기 위해? 나는 무엇에 대해 궁금해 가장 성공적인 사례 중 일부였습니다 그러나 또한 가장 놀라운 일부는? 그리고 너는 마치 우리가 AI를 할 수 있다는 것을 몰랐다 RAJEN SHETH : 예, 예

우리가 본 것들이 많이 있습니다 확실히 특정 산업이 있습니다 더 먼 미래입니다 물론 테크 산업은 많이 사용되고 있습니다 금융 서비스는 이미 많이 사용됩니다

그러나 많은 새로운 사용 사례가 있습니다 나는 꽤 훌륭하다고 생각합니다 제조 라인과 마찬가지로 우리가 보는 몇 가지 예입니다 비전을 사용하여 부품이 양호한 지 여부를 파악할 수 있습니까? 타이어가 공장 라인에서 내려 오는 것처럼 좋은 타이어가 될지 아니면 실제로 그 사람에게 위험을 감수해야한다 그 종류의 것들은 우리가보기 시작하는 것들입니다

소매는 또 다른 경우입니다 당신은 실제로 그것을 어떻게 만들어서 당신이 사용자의 경험을 더 좋게 만들 수 있습니까? 그래서 나는 당신에게 모범을 보일 것이다 우리는 Disney와 AutoML을 사용하고 있습니다 내 아들은 거대한 Lightning McQueen이 될 것입니다 팬, "자동차"

그리고 많은 사람들이 애들이나 가족들을 디즈니 팬들입니다 그는 디즈니 물건에 대한 탐욕스런 식욕이있다 라이트닝 맥퀸 (Lightning McQueen)과 함께 이제 우리가 개발 한 기술로, 당신은 모든 것을 쇼핑 디즈니에서 검색 할 수 있습니다 Lightning McQueen과 함께, 그것을 말하든 말든 묘사에서 또는 아닙니다

그것은 육안 검사로 할 것입니다 그런 종류의 일은 정말로 흥미 롭습니다 흥미로운 사용 사례 그래서 우리는 그것을보기 시작했습니다 내가 중요하다고 생각하는 것들 중 하나는, 그래도 우리는 사업을 시작해야 할 필요가 있다는 것입니다

그들이 생각하지 않는 곳, 이봐, 난 AI를 사용하여이 일을하고 있지만, 어디에서 사용자는 마술을 느끼고 있습니다 그리고 그것이 표지 뒤에 AI인지 아닌지는 중요하지 않습니다 그리고 그것이 내가 생각하는 것입니다 Google 포토 등으로 완성 AI에 관한 것이 아니기 때문에 그것은 정말 대단합니다 그것은 사용자 경험에 관한 것입니다

페르난다 비에 가스 : 정말 대단합니다 그래서 우리는 몇 가지 도전에 대해 이야기했습니다 일부 전략 나는 기회를 끝내고 싶다 우리는 몇 가지 기회에 대해서도 이야기했습니다

하지만 그 메모를 끝내기를 원합니다 작년에 우리는 AI가 존재한다는 것을 보았습니다 정말 흥미로운 방식으로 다양한 도메인에 적용됩니다 그래서 당신에게는 의학, 과학이 있습니다 너는 경작이있다

우리는 그러한 예들에 대해서 이야기하고있었습니다 그리고 저는 여러분 한테서 어떤 기회가 있는지 듣고 싶습니다 당신은 몇 년 동안 그러나 많은 년간 흥분하고 있습니까? 존, 너 시작하고 싶어? 존 플랫 : 좋아 음, 생물 의학 연구에 대해서 언급 하셨 잖아요 그래서 나는 그것에 대해 이야기 할 수 없다

그래서 제가 정말 흥미 진진한 다른 프로젝트에 대해 이야기하게하겠습니다 내가 전에 언급 한 것은 우리가 실제로 융합 에너지를 얻을 수 있는지 알아보기 위해 노력하고 있습니다 실제 상업적 에너지 원 화석 연료를 대체하기 위해 지금 당장은 세상이 너무 타오르다 많은 화석 연료와 대기를 넘치게한다

이산화탄소와 그래서 우리는 실제로 기계 학습을 사용하여 이 회사 인 TAE Technologies 우리는 두 가지 방식으로 도움을주고 있습니다 실험을 최적화하려고합니다 실제로 실험 설계를 돕고 있습니다

최적화를 통해 그리고 실제로 베이지안 방법을 사용하고 있습니다 그들의 기계 내부에서 플라즈마를 디버깅합니다 페르난다 비 에츠 : 오 와아 존 플랏 : 그래서 목표는 이 플라즈마를 뜨거운 태양의 중심으로

우리가 그렇게 할 수 있다면 열 손실률을 측정 할 수 있습니다 우리가 실제로 상업적으로 갈 수 있는지 확인하십시오 관련 융합, 정말, 내 생각 엔, 세상에 혁명을 일으켰습니다 페르난다 비에 가스 : 우리는 언제 그것을 기대할 수 있습니까? JOHN PLATT : 음, 나는 약속 할 것을 원하지 않습니다 저는 2019 년에 훌륭한 과학적 결과를 얻을 것이라고 생각합니다

우리는 그들이 손익분기 점화라고 부르는 것을 가지지 않을 것입니다 하지만 우리는 열을 예측하는 매우 견고한 결과를 보일 것입니다 손실률 그래서 우리는 약 1 년 후에 더 많은 것을 알게 될 것입니다 페르난다 비에 가스 : 굉장해

DAPHNE LUONG : 저에게는 두 가지 사실에 매우 흥분하고 있습니다 첫 번째 일은 계속 진행할 것입니다 실제로 구축 한 Crowdsource 기여자와 협력 다양하고 세계적으로 다양한 데이터 세트, 한 회사가 그 자체로는 건설 할 수 없다는 것, 실제로 모든 사람들을 세계를 대표하는 것에 열정적이다 우리는 소스를 열 수있는 데이터 세트를 만들 수 있습니다 모든 사람이 사용할 수 있습니다

그런 다음 기계 학습을 위해서도 마찬가지입니다 나는 밖에서 자원 봉사를 많이하기 때문에 전 세계의 사회적 기업가들과 함께, 비영리 단체에서 ML을 사용할 수 있는지 확인하고 싶습니다 일종의 대기 질 모델이나 [INAUDIBLE] 책을 할 수 있습니다 그들은 수천명을위한 서적을 만들기 위해 번역을 사용하여 다른 언어들과 모국어로 그래서 저는 그것이 흥미로운 것이라고 생각합니다 나는 그것을 고대하고 있습니다

페르난다 비 에츠 : 좋았어 RAJEN SHETH : 저를 위해서 생각합니다 내가 열정적 인 두 가지가 있습니다 하나는 건강 관리이고 다른 하나는 교육입니다 그리고 건강 관리, 바로이 아이디어 당신이 말했던 것처럼 AI 사용 가능 조기 질병 탐지를 수행합니다

당신은 한 사람에게이 놀라운 영향을 미칩니다 그리고 많은 인간들에게, 그것들과 그 주변의 가족들에게 그런 것들 그리고 저도 그렇게 생각할 수 있습니다 교육, 나는 대부분의 시간을 보낸다 여기 Google에서 교육용 제품을 연구하고 있습니다

모든 학생들이 환경을 상상할 수있는 아이디어 그들이 배우고 싶어하는 방식으로 배울 수 있습니다 자신의 페이스대로, 자신의 스타일로 – 인공 지능으로 변형 될 수있는 힘을 얻는 것 모든 개인의 잠재력을 활용할 수 있습니다 전에 불가능했던 방식으로 페르난다 비에 가스 : 나는 그걸로부터 갈거야 다시 말하지만, 정말로 TensorFlow

js와 같은 것들로 보는 영감 우리는 현재 여러 대학에 교수가 있습니다 누가 이것을 둘러싼 교육 자료를 만들고 있는지 그리고 그것이 정말로 중요하다고 생각합니다 나는 이것에 대해 정말로 흥분한다 이 기술에 진입 장벽, 그러나 그것은 또한 생각합니다

훨씬 더 다양한 세트를 치기 시작합니다 사용에 관심이있는 개발자 다른 것들을위한이 기술 우리가 아직 꿈도 꾸지 못했던 그래서 저는 그것에 대해 매우 흥분합니다 내가 생각하기에 정말 좋은 것은 기계 학습을 둘러싼 대화 방법 윤리와 공정성과 같은 것들을 접하기 시작했습니다 그리고 그것이 정말로 중요하다고 생각합니다 저는 Google에서 매우 깊이 생각합니다

이 질문들에 대해서 연구의 관점에서 볼 때, 우리가 도울 수있는 연구는 무엇인가? 이러한 문제 중 일부를 해결할 수 있습니까? 그러나 정책, 제품 – 현명한, 디자인 – 현명한, 그것은 더 넓은 대화 그래서 저는 우리 패널에 감사 할 것입니다 정말 고맙습니다 그것은 당신의 통찰력뿐만 아니라, 그러나 당신이 당신의 경험을 공유하게하기 위해서, 내가 말했듯이이 주제에 대한 Google의 여러 부분에서 오늘 우리와 함께

고맙습니다 존 플래트 : 고마워 페르난다 비 에츠 : 고마워 [음악 재생]

Supporting diversity and inclusion in AI with AI4ALL

TESS POSNER : 현재 오늘 거기에 인공 지능의 다양성 위기입니다 따라서 기술을 개발하고 개발하는 사람들 우리의 복잡하고 다양한 사회를 대표하지 않습니다

그래서 AI4ALL이 실제로 개발되었습니다 이 다양성 위기를 해결하기 위해, 차세대 지도자 육성 및 육성 AI에서 그리고 Ananya는 놀라운 젊은 여성이며 놀라운 리더입니다 그녀는 AI 여름 캠프를 갔다 그리고 그녀는 AI와 예술을 결합하는 데 너무 열정적이었습니다

그녀는 계속해서 CreAIte라는 것을 발견했습니다 고등학교와 중학교에서 여자애들을 가르치는 그녀의 주도권 학교에서 AI와 예술을 함께 사용하는 법 ANANYA KARTHIK : AI4ALL에서 나는 기억한다 우리 모두는 말한이 티셔츠를 입었습니다 AI는 세상을 바꿀거야

인공 지능을 누가 바꿀 것입니까? 그리고 나는 프로그램에 참석 한 후에 만 ​​생각합니다 나는 AI가 얼마나 큰 영향을 주는지 완전히 깨달았다 우리가 될거야, 우리는 이미, 사회의 다양한 분야에서 그리고 나는 또한 나의 잠재력에 대한 더 많은 자신감을 좋아한다 그 영향에 기여할 수 있습니다 우리는 신경 예술을 통한 기술 제시를 생각했다

어떻게 시각적으로 실용적인 표현 이었는지 예술적 인공 지능은 여러 분야의 관점에서 추진 될 것입니다 창의력에 뿌리를 둔 기술의 그리고 그것은 소녀들에게 매우 힘이됩니다 이 이벤트에서 내가 가장 좋아하는 부분 중 하나 이 새 여자들을 모두 만나는 일종의 배우고 자신 만의 독특한 시각을 가지고 싶어한다 그들이 만드는 예술에 대한 경험 우리의 신경 예술 전시회에서 전시됩니다 내가보기 엔 정말 흥분된다

그리고 그것은 창조적 사고와 다양성입니다 우리가 미래의 기술에 필요하다고 생각합니다

Minigo: Building a Go AI with Kubernetes and TensorFlow (Cloud Next ’18)

[음악 재생] 앤드류 잭슨 : 좋아, 안녕하세요 제게 합류 해 주셔서 감사합니다

여러분 모두가 좋은 한 주를 보내길 바랍니다 이것은 Minigo에 관한 이야기 ​​일 것입니다 얻은 20 % 프로젝트의 이야기입니다 통제 불능이다 세상에, 너 밖에 많은 사람들이있어

그래서 모두 와줘서 고마워 그러니 Minigo가 무엇인지에 대한 질문으로 시작하겠습니다 그리고 Minigo go는 오픈 소스 독립적 인 구현입니다 알파 제로 (AlphaGo Zero) 알고리즘 그래서 모두의 손을 빠르게 보여줄 수 있습니까? 누가 알파고에 대해 들어 봤어? 그것은 많은 손입니다

그래서 AlphaGo Zero 알고리즘은 "Nature"에 게시되었습니다 그것은 전문적인 인간을 이길 수있는 최초의 AI입니다 그리고이 이야기는 Minigo를 다루겠습니다 무엇 자체가 이동합니다 기계 학습에 대한 간단한 소개

클라우드 대회입니다 나는 그것을 추측하고 싶지 않다 우리는 일종의 회오리 바람 여행을 할 것입니다 학습 및 Minigo에 적용하는 방법 그러나 우리가 정말로 여기에서 이야기하고있는 것 Google에서이를 어떻게 확장 할 수 있었는지 클라우드 플랫폼

그리고 저는 데모를하고 조금 이야기 할 것입니다 우리가 배운 것들에 대해, 바라 건데,이 유용 할거야 시작하려면 Minigo가 무엇입니까? 어디에서 찾을 수 있습니까? GitHub입니다 거기서 확인하십시오 TensorFlow 아래에 있습니다

githubcom– 또는 거기에, 나는 생각한다 githubcom/tensorflow/minigo 부담없이 간단한 요청을 확인하십시오

다시 말하지만, 공식 Google 프로젝트는 아닙니다 나는 여기서 처음부터 강조 할 필요가있다 Minigo는 AlphaGo가 아닙니다 우리는 DeepMind와 제휴하지 않았습니다 우리는 딥 마인드와 관련이 없습니다

나는 출판 된 저작물만으로이 코드를 작성했습니다 나는 그들의 소스 코드에 접근 할 수 없다 나는 그것을 검증하기 위해 소스 코드를 사용하지 않았다 왜 DeepMind가 AlphaGo를 만들었을 때 나는 이것을 어떻게 했습니까? 왜 미니고를 만들 필요가 있었습니까? 음, 처음에는 Go Player로 갈거야 Google의 소프트웨어 엔지니어가되는 것 외에도, 나는 또한 미국 이동 협회 (American Go Association)에 자원하여 나는 이사회에서 봉사한다

거의 12 년 동안 American Go에서 근무했습니다 나는 계속 해왔다 내 인생의 상당 부분을 위해 가라 그리고 나는 그것을 좋아한다 그리고 AlphaGo는 놀랍습니다 너가 Go 선수이고 외계인 정보원이라면 상상해 보라

만들어졌으며 당신의 언어를 구사합니다 Go는 선수들입니다 우리는 AlphaGo에 대해 정말 흥분했습니다 그러나 AlphaGo는 은퇴했습니다 그래서 나는 내가 총을 맞아야 할지도 모른다고 느꼈다

이것을 창조하려고 노력할 때 그래서 Go 선수로 생각하는 것들이 많이 있습니다 우리는 AlphaGo에서 할 수 있고 배울 수 있습니다 여기에는 풍부한 혈관이 있습니다 내 것이고

그래서 Minigo에 대한 우리의 목표는 결과를 재현하는 것이 었습니다 프로그램의 명확하고 읽기 쉬운 예를 제공합니다 당신이 GitHub에서 그것을 확인한다면, 나는 당신이하기를 희망합니다 파이썬은 약 2,000 줄에 불과합니다 이 알고리즘은 세계를 변화시키는 알고리즘에 매우 좋습니다

이것도 전시하고 시연 할 수 있기를 바랍니다 Google Cloud의 강력한 기능 이것은 기본적으로 부부 였기 때문에 엔지니어가 여가 시간에 20 %의 시간을 보냈습니다 이것을 구현하려고합니다 우리가 할 수있는 유일한 방법은 우리가 찾을 수있는 가장 긴 레버 암을 사용했습니다 그리고 레버리지는 동사입니다

다른 것 그러나 문자 그대로 여기서 나는 그것을 의미한다 아주 작은 소프트웨어 인 힘 배수로서 엔지니어링 팀 Minigo는 어디에서 왔습니까? 그래서 AlphaGo와 DeepMind는 3 개의 논문에서 설명되었습니다 첫 번째 논문에서는 AlphaGo, 그리고 그것은 "깊은 신경과 함께하는 게임을 마스터하는 것"입니다

네트워크 및 트리 검색 " 그것은 "Nature"에 발표되었습니다 그리고 내 친구 브라이언 리 (Brian Lee) MuGo 또는 MicroGo라고 불리는 이 첫 번째 버전의 구현 그는 일종의 골격 구현을했습니다 그것은 네트워크의 절반을 구현했지만 나머지 절반은 구현하지 않았습니다 일종의 개념 증명이었습니다

AlphaGo 이후 두 번째 논문 "AlphaGo Zero"라고 불렀습니다 AlphaGo Zero는 알고리즘을 설명합니다 무작위 소음에서부터 시작된 그 다음에 어떻게 나아가 야하는지 가르쳐주었습니다 알파 조 제로 (AlphaGo Zero)의 종이와 제 친구 Brian의 MuGo 구현, 우리는 Minigo를 얻습니다 Minigo의 로고가 왜 그렇게 궁금한가요? 행복 한 찾고 로봇 사다리 떨어져 떨어지는, 모두 명확해질 것이다

나는 그가 왜 완전하게 보이는지 설명 할 것이다 그가 사다리에서 떨어지는 상황에 쉽게 대처할 수 있습니다 좋아요, 그래서 바둑 게임에 대해 이야기 해 봅시다 얼마나 많은 사람들이 놀았습니까? 아무도 없어요 와우, 그건 많은 사람들이야

얼마나 많은 사람들이 나가기를 좋아합니까? 예, 정확히 제가 듣고 싶은 것입니다 나도 좋아해 나는 오랫동안 이동을 해왔다 나는 그것을 정말로 좋아한다 그래서 우리는 할 것이다

무엇이 가야하는지에 대한 간단한 데모 이것은 처음에 보이는 것입니다 사람들은 차례로 돌을 내려 놓습니다 영토를 둘러싸고있는 보드에 캡처에 대해 이야기 할 때 캡처는 다음과 같습니다

돌들이 완전히 둘러싸여있을 때, 그들은 보드에서 벗겨진다 그것은 또한 돌의 더 큰 사슬에서 작동합니다 따라서 직각으로 연결된 그룹 그들의 운명을 나눕니다 그랬듯이 우승자는 다음과 같이 결정됩니다

당신이 보드를 나눌 때, 누구든지 더 많은 영토가있다 그게 전부 야 마치지도에 선을 그리는 것과 같습니다 니가 조각하고있어 나는 이것을 얻는다

당신은 그것을 얻는다 오른쪽 다이어그램에서 흰색이 둘러싸인 것을 볼 수 있습니다 모든 삼각형 모양의 점과 검정색이 둘러싸여있다 모든 제곱 된 점들 이것은 Go가 정말로 일종의 절대주의 게임이 아니라는 것을 의미합니다

당신은 적의 왕을 잡아야 만합니다 또는 적군을 완전히 파괴하십시오 계약을 협상하는 것보다 더 낫습니다 어디 좀 더 알고 싶습니까? 다른 사람보다 그리고 이것은 전체 게임이 어떻게 생겼는지에 대한 예입니다

그래서 이것은 Minigo의 행동입니다 영토를 스케치하는 걸 볼 수 있습니다 모퉁이에서 시작 그리고이 패턴은 바로 거기에서 일어나는 것을 봅니다 그것은 사다리라고합니다

사다리는 Go가 어려운 이유의 흥미로운 예입니다 그래서 이것은 꽤 솔직한 패턴입니다 당신은 그것이 다시 발전하는 것을 볼 수 있습니다 그것은 정말 명백한 패턴입니다 그것은 유아가 아마도 따라와 예측할 수있는 패턴입니다

Go가 매우 긴 지평을 가지고있는 예입니다 효과, 그 사다리의 결과 게임의 결과를 결정할 수 있습니다 그리고 앞으로 80 ~ 90 회의 움직임을 바라 볼 필요가 있습니다 그리고 왜 그렇게 어려운가? 사다리가 위대한 본보기예요 네가 가진 게임의 어디 까지나 분기 인자만으로도 각각의 경우에 대해 두 가지 움직임을 살펴보면, 이미 80 번에서 2 번까지 찾고 있습니다 실례합니다

가능한 위치 그래서 매우 높은 브랜칭 인자 정말 어렵게 만듭니다 게임은 정말 길다 최종 조건은 설명하기가 정말로 어렵습니다 Go와 함께, 당신은 – 체스와 함께, 왕이 체포되거나 장담 당했을 때, 게임은 끝났다

그리고 모두가이 게임이 끝났음을보고 동의 할 수 있습니다 Go를 사용하면 게임은 두 선수는 아무것도 남지 않았 음에 동의합니다 논쟁 할 가치가있는 이사회에 니가 있으면 이거 꽤 어렵다 게임이 어떻게 끝났는지 컴퓨터에 가르치 려합니다 사실, 그냥 보드 득점, 그냥 알고 보드를 채점 할 때가되었다는 것은 정말 어려운 문제입니다

그리고 마지막으로, 아마도 이것이 가장 중요 할 것입니다 부분적으로, Go에서 정말 힘들다 게임 중간에 누가 이기고 있는지 판별 할 수 있습니다 이것은 하나의 그래서이기는이 문제와 누가 이길 것인가 – 우리가 가진 가장 어려운 문제 중 하나입니다 분기 요인을 다루는 것은 너무 많다는 것입니다

모든 점에서 가능한 움직임, 정말 어려운 것 중 하나 우리가 풀어야 할 문제 그리고 한발 뒤로 물러서서 우리가 어떻게 접근할지 이야기해라 이 기계 학습 그래서 이것은 기계 학습에 관한 5 개의 슬라이드입니다 분명히 이것은 포괄적 인 설명이 아닙니다

나는 또한 언급해야한다 아마도 이것은 아마도 좋은 시간 – 우리 중 누구도 Minigo 팀에 박사 학위를 가지고 있지 않습니다 아마도이 잠재 고객에 사람들이있을 것입니다 누가 나를보다 잘 이해하지만, 나와 함께 견뎌야합니다 나는 이것이 사람들에게 계몽되기를 희망한다

누가 전에 전혀 기계를 배우지 않았을 지 모릅니다 신경 네트워크를위한 진짜 빠른 추론 그래서 기본적인 생각은 우리가 입력을 넣을 것입니다 출력물을 꺼내서 중간에 그 것을 우리가 이야기하는 모델입니다 우리는 너무 많이 걱정하고 싶지 않다

우리가 알아야 할 것을 제외하고는 그것이 무엇인지에 관해서 그것에 대해 몇 가지 첫 번째는 그것이 수학의 무리라는 것입니다 그것은 차별화가 가능하거나 차별화되기에 충분히 가깝습니다 두 번째는 정말 느리다는 것입니다 평가할 때 밀리 초 단위로 느리게 진행됩니다

그리고 그것은 왜 그것이 밀리 세컨드가 걸리는지 중요합니까? 그것은 꽤 빨리 보인다 글쎄요, 아마 수천 개의 당신이 할 수있는 움직임을 결정할 수 있습니다 그래서 추론을위한 신경망을 고려할 것입니다 이 추측 경로를 의미하는 추론, 우리는 우리의 의견에서 시작하여 우리의 결정을 내린다 그것이 바로 추론입니다, 그것은 또한 순회라고합니다

그리고 우리는 그것이 느리고 차별화 될 수 있다는 것을 알아야합니다 좋아, 그럼 어떻게 그 모델을 만들지? 중간에 그거? 음, 우리가하려고하는 것은 우리가 시도하고 양을 정할 것입니다 우리가 알고 있고 입력하는 입력이있는 오류 우리가 얻었어야 했어 그리고 우리는 그것들 사이의 차이점을 살펴볼 것입니다 차별화 할 수있는 모델을 시도하고 변경하십시오

그래서 우리는 우리에게 필요한 방향을 알고있다 그 모델에서 다른 값을 밀어 넣는다 오류를 줄일 수 있습니다 이것이 바로 기본적으로 기계 학습입니다 간단히 말해서 – 확률 적 구배 강하 기계 학습의 형태

하지만 그래, 그것은 선형 대수의 더미, 우리는 그것을 조정하려고 노력할 것입니다 그리고 우리는이 과정을 우리가 시도하는 곳에서 반복 할 수 있습니다 우리가 다 떨어질 때까지 오류를 약간 작게 만듭니다 데이터의 그 기능, 그 모델은 중간에 수 많은 변수의 함수 일 수 있습니다

근본적으로 우리는 손실을 최소화하려고 노력하고 있습니다 백만 변수 함수의 그리고 그것은 꽤 복잡합니다 그러나 운좋게도, 꽤 좋은 추상화가있다 이 모든 일을하기 때문에

그러니 계속 가자 그렇다면 Minigo에 대한 추론은 무엇입니까? 이 문제를 해결하기 위해 그것을 사용할 것입니까? 이 경우 Minigo에 대한 추론은 두 가지 질문을 의미합니다 우리는 어떤 움직임을 가져야 하는가, 누가 우리가 이기게 될 것이라고 생각 하는가? 그래서 당신이 왼쪽에 보인 그 보드가 우리의 의견입니다 우리는 Minigo에게 확률에 대해 물어볼 것입니다 다음 이동이있을 것으로 생각되는 곳의 분포

그리고 우리는 또한 그것을 표현하는 숫자를 물어볼 것입니다 누가 그것이 이길 것이라고 생각하는지 Minigo는 흰색이 이기기 위해 음수 1을 사용합니다 그리고 흑인이이기려면 1이 양수 제로는 전화하기에 너무 가깝다 – 완벽하게 균형 잡힌 – 음수 1에서 1 사이의 모든 위치에 그것이 이기기 위하여려고하고있는 누구를 계량하고 있는가

그래서 두 가지 산출물이 주어지면, 무엇입니까? 우리가 생각하는 움직임은 재생 될 것입니다 우리는 누가이기겠다고 생각합니까? 몬테 카를로 나무 수색이라고 칭한 무언가를하십시오 내가 언급 한 나의 친구 Brian Lee는 MuGo를 썼다 Pycon 2018에서 "Monte into A Deep Dive"라는 훌륭한 연설을했습니다 카를로 트리 검색 "코드

또한 우리 코드는 GitHub, Monte Carlo tree에 있습니다 검색은 정말 훌륭하고 읽기 쉽고, 추천 그래서 몬테카를로 트리 검색으로의 깊은 잠수가 좋습니다 따라서 몬테카를로 트리 검색을 통해이 셀프 플레이를함으로써, 우리는 오류를 정량화 할 수 있습니다 그래서 우리는 Minigo에게 어떤 움직임과 앞으로 나아갈 것인지에 대해 물었습니다

이제 우리는 오류를 합계로 정의 할 수 있습니다 원래 견적과의 차이점 실제로 움직일 움직임과 실제로 있었던 움직임 트리 검색으로 탐험 그래서 우리는 누가 가는지에 대한 견적을 사용합니다 우리가 그 움직임을 계속 탐구할지 여부를 결정하기 위해 승리하는 것 우리는이 움직임을 살펴볼 것입니다

그 다음으로 가장 가능성있는 것을보십시오 더 좋든 나쁘 든간에, 아마도 우리는 부모 이동을 탐색하지 않습니다 이해가 되니? 어쩌면? 인정할 수 있을까요? 이것이 일어날 수 있고, 우리는 할 수있다 나중에 세부 사항을 파헤 치십시오 좋아, 몬테카를로 나무 검색이야

누가 앞서고 있는지 움직이고 앞으로 나아갈 두 가지 요소 – 정책이라고 부르며 가치 신경망의 출력 따라서 정책에는 이사회의 주 (州) 다음 플레이는 어디에서 이루어질 것이라고 생각합니까? 그리고 가치는이 보드를 어떻게 평가할 것인가입니다 좋아, 그럼 빨리 정리하자 그것은 다섯 번째 슬라이드였습니다

이 슬라이드는 요약 슬라이드입니다 슬라이드 6 개를 얻는 방법입니다 이것은 우리의 보강 학습 요약입니다 강화 학습의 번개 버전 – 우리의 데이터를 사용하여 모델을 만들고, 우리 모델을 사용하여 더 많은 데이터를 만들고, 이제 우리는 데이터가 부족하지 않습니다 우리는 우리가 원하는만큼 이것을 계속 할 수 있습니다

그래서 모델은 무엇입니까? 모델은 우리가 중간에 가지고 있던 수학 더미입니다 우리는 그것을 비교함으로써 손실을 측정 할 수 있기를 원합니다 우리가 알고있는 해답이나 해답을 가지고 우리가 알고 있다고 생각하는 것 우리는 그 오류를 최소화함으로써 모델을 훈련시킨다 Minigo는 정책과 가치를 사용합니다

트리 검색을 수행하여 원본 견적을 수정하십시오 말이 돼? 어쩌면 누군가, 그렇지? 좋아, 우린 계속 진행할거야

강화 학습 루프 – 아주 간단합니다 우리가 설정할 수있는 좋은 덕목입니다 셀프 플레이가 더 나은 데이터를 만드는 곳, 더 나은 모델을 만들기 위해 훈련에이 방법을 사용합니다 그리고 그들은 서로를 강화합니다 문제는 – 나는 그 오류 중 하나를 상당히 크게 만들었고, 그건 사고가 아니에요

그 아이디어는 트리 검색을하는 것입니다 이러한 추론이나 전달 전달의 많은 수행 우리는 우리만큼 많은 정보를 원합니다 정책을 개선 할 수 있어야합니다 그리고 그것은 아마도 수백 또는 수천 개를하는 것을 의미합니다

각 이동 당 추론의 이제, 우리가 각각의 움직임에 대해 훈련 할 수 있다면, 그것은 우리가 수백 또는 수천 개의 추론을하고 있다는 것을 의미합니다 우리가 만드는 훈련 데이터 포인트 당 그래서 최소한이 비율을 가질 것입니다 우리는 추론을 할 때 수백에서 한 가지를해야합니다

대 훈련 단계 만들기 그런 종류의 문제가 여기에 설정되어 있습니까? 그래서 충분히 훈련시키기 위해서, 나는 수백만 게임에이를 수행해야하며, 그리고 나는 게임이 몇 분 정도 걸린다는 것을 안다 심지어 GPU 나 TPUs를 사용하고 있습니다 그래서 제 질문은 어떻게 확장합니까? 이제, 행복하게 이것은 문제입니다 당황스럽게 평행 한 누군가의 말을 빌리 자

Minigo의 사본 두 장이 서로 연주하면됩니다 다른 사본을 포함하지 않는다 미니 고 (Minigo)는 내가 이들 중 많은 것들을 회전시킬 수 있다는 것을 의미합니다 내가 할 수있는 한, 나는이 모든 것을 제거 할 좋은 방법이 있다고 가정한다 이 모든 것을 확장 할 수 있습니다

그리고 그것은 우리에게 이야기의 일부를 가져옵니다 우리 모두 여기에 온 것 같아 Google Cloud에서 이것을 사용하고 있습니다 그래서 우리는 이것을하기 위해 Kubernetes를 사용했습니다 그러나 가능한 한 최소 단위의 작업을 시작했습니다

우리가 할 수있는 그래서 우리의 훈련은 매우 간단했습니다 우리는 작업자가 클라우드 저장소를 사용하도록했습니다 우리가해야 할 일을 조정할 수있는 방법으로 이것은 정말로 잘 돌아갔다 클라우드 스토리지는 매우 유연하며, 모든 종류의 재미있는 방식으로 학대 할 수 있습니다

우리는 Cloud Storage를 사용하여 추적기 탄환의 종류, 우리가 결정하는 동안 중앙 집중식 서버를 작성해야합니까? 아니면 서버에 대해 이야기 할 필요가 있습니까? 기본적으로 클라우드 스토리지는 핵심 요소로 확장되었습니다 우리는 정말로 신경 쓰지 않았습니다 그래서 그것은 훌륭하게 일어 섰고 우리는 아마 한계를 넘어서서 그것을 사용할 수 있었다 우리는 확실히 우리가 할 수 있다고 생각했습니다 우리가 한 일은 이것을 용기로 바꾸는 것입니다

그래서 Docker를 사용하여 컨테이너를 만들었습니다 그 자기 부담 임금 노동자를 위해, 우리는 이것을 확장하기 위해 Kubernetes를 사용했습니다 수천 개의 노드로 이동합니다 우리가 그렇게 했으니 시작할 수 있었고, 우리는 최신 모델을 가져올 수 있습니다 우리는 우리의 데이터를 쓸 수 있습니다

우리는 다시 문을 닫고 다시 시작할 수 있습니다 그리고 매번 우리는 최신 버전을 가져 왔습니다 우리는 항상 모델을 조정하고 확신 할 수 있습니다 우리는 최신의 최고의 모델로 새로운 데이터를 생성하고 있습니다 우리가 가지고있는

그래서 원래 우리가했던 것은 원래 우리가 작은 보드 크기로 작성했습니다 그래서 내가 처음에 보여 줬던 원래 도표들 Go가 19 대 19의 보드에서 플레이하고 있었다 그것은 Go의 풀 사이즈 게임입니다 Go는 9 x 9 보드에서도 사용됩니다 그리고이 9 by 9 보드는 훨씬 더 간단합니다

그 모델은 약 250 배 빠릅니다 그래서 우리는 검증을 정렬 할 수있었습니다 더 작은 Go 보드에서 그 더 작은 모델을 사용하여 정확성 그리고 나는 매우 느슨한 정확성을 사용하고 있습니다 그 결과, 기계 학습 귀하의 데이터에서 패턴을 찾는 것이 매우 좋습니다

거기에 넣으려고하지 않은 데이터의 패턴 그것은 당신이 저지른 실수를 은폐하는 데 아주 좋습니다 그래서 우리는 우리의 더 작은 크기의 보드에서 정말 끔찍한 버그가 있었다 우리가 나중에 발견 할 수는 있지만 그 이상은 발견되지 않을 것입니다 우리가 한 다음 일은 – 우리가 이것을 한 후에 작은 보드에 대한 우리의 정확성, 우리는 거룩한 암소, 풀 사이즈 모델을 깨달았습니다

250 배 느려질 것입니다 가속기를 추가해야합니다 그래서 우리는 최소한의 소동으로 GPU를 연결할 수있었습니다 우리는 약 2,100 GPU의 클러스터를 돌리고있었습니다 모든 문제가 전혀없는 단위

Kubernetes에서 GPU를 사용하는 것은 환상적입니다 그것은 우리가 운전자에 대해 걱정할 필요가 없다는 것을 의미합니다 우리는 코드를 변경할 필요가 없었습니다 우리 워크 스테이션에서 실행 된 것은 완벽하게 돌아갑니다 Kubernetes 엔진에

그리고 이것은 꽤 큰 성공이었습니다 그러나 그것은 아직도 조금 느렸다 우리는 벤치 마크 성능 수치를 보았습니다 우리가 치려고했던 것 그래서 AlphaGo 논문의 숫자 그들은 0

4에서 1,600 개의 추론을 수행 할 수 있었다고 설명했다 초 우리는 그보다 약 40 배 더 느리다 파이썬 (Python) 솔루션의 경우에는 괜찮습니다 TPU가 아닌 가속기의 경우 그러나 40 배 느린 것은 40 배 느린 것을 의미합니다

그들은 3 일 만에 500 만 게임을 훈련하고 훈련 할 수있었습니다 그리고 우리가 그것보다 40 배 더 느리다면, 3 개월이 걸리는 걸보고 있습니다 그래서 약간의 도전입니다 이 작업을 더 빠르게 수행 할 방법을 찾아야했습니다 그래서 우리가하기 전에 조금 단계를 밟아 봅시다

GPU에서이 문제를 설정하는 중입니다 나는 이것이 달 달이 걸릴 것이라는 점을 깨닫고있다 나는 진짜로 확인하는 방법을 찾고 싶었다 모든 일이 잘되고있다 그래서 컨테이너로, 그것은 정말로 쉬웠다

내가 일하고있는 일에 변화를주기 위해 실제로 다른 종류의 평가 일치를 실행하려고합니다 Kubernetes 엔진을 사용하는 것은 정말 쉬웠습니다 API는 변형 된 작업을 회전시키고, 그래서 다른 버전의 모델을 테스트 할 수 있습니다 내가 진전하고 있는지 확인해 이것은 정말로 중요한 것이 었습니다

나는 나중에 다시 돌아올거야 그리고 내가 말할 때, 성능 측정, 나는 내 일에 대한 성과를 측정하고있다 그게 내 모델이 실제로 Go를하는 것이 더 좋아 지는지? 그게 진짜 질문입니다 그래서 일찍, 나는 이것이 3 개월이 걸릴 것을 알았다 클라우드 TPU가 개발되는 시점에서 나는 말했습니다

이봐,이게 정말 잘 될지도 몰라 클라우드 TPU에서 실행 해보십시오 클라우드 TPU 팀은 매우 열정적이었습니다 그리고 그들은 말했다, 그래, 물론, 바로 가라 그러나 그들은 훨씬 더 빨라서 내가 원래 가지고 있었던 것을 재평가하는 것이었다

내 파이프 라인 작성 참고로 2,000 개의 GPU를 사용하고있었습니다 몇 세대가 지나서 고의로 어떤 종류의 직접적인 수치 비교도하지 않아야합니다 그러나 파이썬에서 이전에 괜찮 았던 것이 무엇인지 말해 주기만하면됩니다 클라우드 TPU를 사용하여 더 이상 문제가 없습니다

그 코드가 충분히 빨라질 것입니다 이 TPUs를 효과적으로 사용할 수있게 될 것이라면, 나는이 파이프 라인이 어떻게 이루어 졌는지 진지하게 다시 생각할 필요가있다 도망 갈거야 3 달 동안 뭔가를 할 계획이라면, 그리고 지금 당신은 아마 1, 2 주 정도를보고 있습니다 너는 아주 다른 제약이있다

입력 데이터를 사전 처리하는 데 걸리는 시간, 느슨하게 밀어내는 데 얼마나 걸릴 수 있습니다 새로운 모델의 결과 그것은 모든 종류의 일입니다 그래서 우리는 TPUs를 다시 작성해야했습니다 이 코드는 몬테카를로 트리 검색입니다

몬테카를로 트리 검색을위한 짧은 의사 코드입니다 그리고 그 라인에주의를 기울이고 싶습니다 NeuralNetevaluate (leafgame)는 말합니다

국가), 그것은 그것이 갑자기이 모든 것이기 때문에 병행해야했다 그리고 그것은 할 수있는 것보다 훨씬 더 빨리 병렬로 갈 필요가있었습니다 그래서 이것은 부분이었습니다 이 작업을 신속하게 처리 할 수있는 엔진은 우리는 다시 쓸 필요가있었습니다 이것이 단일 스레드 버전에서의 모습입니다

이것은 파이썬 코드가 실제로 무엇에 가깝습니까? 오늘 Minigo에서와 같이 보입니다 TPU에 대한 내용을 다시 작성하여이를 해결했습니다 멀티 스레드 버전으로 내 친구가 자원해서 C ++을 다시 작성했고, 그는 아마 내가 자기 이야기를 말하는 것처럼 가지 않을거야 그러나 그는 완전한 멀티 쓰레드를 작성할 수있었습니다

이행– 문제 없음, 버그 없음, 완전히 다시 쓰는 것, 멀티 스레드 코드, 버그 없음, 경쟁 조건 없음, 그런 문제는 없습니다 그러나 그는 실제로 루프를 증가시키는 것을 잊었다 디버깅하는 데 며칠이 걸리는 잔인한 버그가 남았습니다 그는, 오, 나는 그렇게 나빴어 나는 마치, 당신은 방금 완전한 재 작성을했다

처음에는 버그가 없었던 다중 스레드 코드가있었습니다 그리고 당신은 그 일에 열심히 노력할 것입니다 어쨌든이게 그 모습입니다 우리는 C ++ 포트에서 컨테이너를 만들었습니다 파이썬 엔진을 시작하면, 우리는 다음과 같은 RPC 호출을 할 것입니다

우리 대기열에 모든 노드를 실행하기에 충분한 노드가있었습니다 모델 그리고 이것은 훌륭했습니다 그것은 또한 우리의 C ++ 코드가 더 이상 의존하지 않음을 의미합니다 TensorFlow에 설치 했으므로 건물에 문제가 없었습니다

TensorFlow는 빌드를 훨씬 빠르게 만들었습니다 그것은 꽤 시원하다 그리고 일단 우리가이 엔진을 가지고 있었으면 이제 우리는 배포 사용으로 바뀔 수있다 Kubernetes 엔진에 이전에는 GPU를 사용할 때 배치 API를 사용했습니다

손의 신속한 표시, 사용한 사람 Kubernetes이 방에 들어가기 전에? 멋지다 멋지다 배치 API는 실제로 잘 작동했습니다 2,000 노드로 우리는 몇 가지 흥미로운 제한을 가졌습니다 완료 추적

그리고 우리가 한 일은 귀찮게하지 않았습니다 우리는 일자리를 우리가 무언가를 세운 곳으로 썼다 100,000 개의 완료와 같습니다 그리고 실제로 그렇게 할 것입니다 그것은 약 1,000 년 후에 완공을 버릴 것이다

그것은 그것이 끊임없이 계속 실행된다는 것을 의미했습니다 우리가 원하는 것이 었습니다 완료 – 배치 API로 작성 정말 잘 돌아갔다 다시 해 보다 그것은 우리를위한 재시도 논리를 처리 할 것입니다

그것 모두는 정말로 잘 돌아갔다 그러나 이제 Cloud TPUs를 사용하여 용기가 떨어지는 대가를 치르고 싶다 다시 올라와 그래서 우리는 그것들을 배치로서 장기 실행 작업으로 작성했습니다 그리고이 모든 것이 정말 잘되었습니다

우리는 더 이상 완료를 추적 할 필요가 없었습니다 우리는 이들을 장기간 일자리로 쓰고 있었기 때문에 그래서이 모든 것이 단지 기본적으로 기본적으로 이루어졌습니다 Minigo의 장점 중 하나는 우리는 이것을 시험 할 수 있었다 그래서 Minigo는 전적으로 공개됩니다

GitHub에서 모두 사용할 수 있습니다 이 전체 프로젝트를 통해, 나는 똑같은 길을 따라 가고 있었다 외부 고객이 따를 것입니다 비록 내가 Google 직원이지만, 나는 기본적으로, 똑같은 과정을 겪고 있었다 이 방에있는 누군가는 그들이 그것을 통과하려한다면

그리고 그것은 꽤 좋은 경험이었습니다 솔직히, 나는 더 적은 길을 쳤다 또한이 제품들이 많았지 만 사전 알파 또는 알파 준비 중이었습니다 그리고 그 경험은 솔직히 놀랍습니다 Kubernetes Engine의 클라우드 TPU는 기본적으로 상자 밖으로 일했습니다

내가 말했듯이, GPU 용 Ditto는 드라이버 문제 걱정할 필요조차 없었습니다 그래서 당신이 ML을하거나 가속을 할 생각이라면 Kubernetes Engine에서 컴퓨팅, 나는 기본적으로 그것에 대해 좋은 말을해라 그래서 꽤 좋습니다 Minigo에 대한 간단한 데모를하겠습니다 이 게임을 만드는 방법이 있다고 생각합니다

그러나 나는 그것이 무엇인지 모른다 우리는 거기에 갈 그렇게 보입니다 그래서이 미니고 -이 특별한 게임에 대해 생각해 봅시다 그 작은 크기의 보드입니다

나는 이것이 실제로 CPU에서만 실행되고 있다고 생각한다 노트북에 Chromebook 일 수도 있습니다 그래서 이것은 그 작은 것에서 완전히 무섭지 않고 달리고 있습니다 내가 너에게 말한 Go 사이즈

그리고 그것은 반복되지 않습니다 이것은 불행합니다 하지만 그 변화가 오른쪽 상단에서 고려할 때, 무엇을 그것은 가장 가능성이 큰 움직임이라고 생각한다 왼쪽에서 일어난다 그리고 이것은 꽤 훌륭한 도구입니다

만약 당신이 Go Player라면, 정말로 파고 들어가서 그것에 대해 생각하고있는 것을 보아라 왜 좋아하는지, 좋아하지 않는지 – 꽤 좋아 좋아, 그럼 우리 결과에 대해서 이야기 해 좋아, 그럼 결과는 알았어 그래서 결론을 얘기해

그리고 배운 교훈, 나는 조금 이야기하고 싶다 여기에 우리가 가진 경향에 대해, 이것은 GPU에서 TPU로 이동하고 있습니다이 경우, 이것들은 최신 TPU에 대한 오래된 GPU였습니다 눈을 뜨게되었습니다 우리가 더 많은 일을 할 수있는 능력 기본적으로 같은 양의 전력으로 사용자가 우리의 인센티브를 맞출 수 있음을 의미합니다

클라우드 제공 업체는 최신의 가장 빠른 하드웨어를 사용할 수 있습니다 기본적으로, 우리가 사람들이 이전 버전의 하드웨어를 사용하게하고, 최신 버전의 하드웨어 동일한 와트 수로 더 많은 작업을 수행 할 것입니다 우리가 정말로 당신이 가장 새로운 것을 사용하기를 바랍니다 양철통 이걸로 유지되는 한 우리가이 압력을 가할 것입니다

우리의 코드는 가능한 한 빨리 간다 그리고 이것은 환상적이다 특히, 연구를 할 때, 이러한 솔루션에서 전화를 거는 경우, 너는 실험 할 수 있어야 해 당신이 할 수있는 한 빨리 있을 수도있는 일을 시도 할 수 있어야합니다

다른 방법을 시도하기에는 너무 비싸다 이렇게 성능면에서 가장 좋은 가격을 사용하게하는 성과 당 가격 가장 빠른 것을 사용하고 느린 것을 사용하지 말고, 모델에서 실제로 전화를 걸 수 있음을 의미합니다 우리가 만들고자하는 것, 우리가 정말로 할 수있는 것 우리가가는 방법을 더 빨리 반복 모델을 개발하는 방법에 대한 다양한 아이디어를 테스트 할 수 있습니다 그러나 그것이 의미하는 것은 그 수단입니다 당신은 당신의 파이프 라인이 더 빨라질 수 있도록 계획해야합니다

다시 말하지만, 원래는 몇 달 정도 걸릴거야 그리고 지금, 우리는 그것은 1, 2 주 만에 끝났습니다 그리고 그것은 우리의 핵심 가정들을 얼마나 오래 변화 시켰는지 우리는 다른 단계를 많이해야 할 것입니다 그 파이프 라인에있는 것 같아 계속할 것입니다

그래서 확실히 당신은 그에 따라 계획하고 싶습니다 저것은 구름 가장자리 TPU,이다 작은 UBS 실리콘 껌 우리가 Minigo를 만들려고 붙잡아 라 나는 정말로 그 것이다 흥분 이 개념과 관련하여 파이프 라인이 진행 중입니다

빨리, 우리는 정말로 시도하고 만들고 싶다 우리의 모델은 가축과 비슷하고 애완 동물과 비슷합니다 가축을 가진 너희들은 애완용 유머가 없다 어떤 사람들은 아이디어를 얻고 있습니다 아이디어 컨테이너를 사용하면 정확한 빌드를 재현 할 수 있습니다

실행중인 소프트웨어의 내 서버는 상호 교환 가능하다고 말할 수 있습니다 나는 그들 중 많은 것을 얻을 수있다 나는 그 이름을 말할 필요가 없다 그것은 특별하지 않다 죽거나 내려 가거나 부서지면 크게 문제가되지 않습니다

나는 그것을 재건해야한다 같은 방식으로 우리는 우리의 신경망 모델을 원합니다 그와 같기도합니다 3 개월이 지나면 소유욕이 생깁니다 마찬가지로, 당신은 정말로 어떤 일이 일어나는 것을보고 싶지 않습니다

그러나 하루나 이틀 만에 새로운 것을 만들 수 있다면, 이제 자유롭게 실험하고 시도 할 수있는 자유가 있습니다 소지품 그리고 그 변화를 지킬 수 있다는 것을 의미합니다 훨씬 더 잘 격리되었습니다 몇 달이 걸렸던 GPU에 대한 초기 작업을 통해, 끊임없이 모니터하는 것이 유혹적이었습니다

대시 보드, 시도하고 몇 가지 손잡이를 조정, 여기저기서 다이얼을 돌리고 시도해보십시오 걱정하고 걱정할 필요가 없습니다 그러나 그것은 또한 그 과정의 끝에서, 그 사물의 순서를 어떻게 정확하게 재현 할 수 있을까요? 그게 일어난거야? 정말 힘들다 훨씬 더 반복적이라는 것을 의미합니다 그리고 그것은 꽤 위대합니다

꽤 흥미로운 또 다른 일 여기에 이러한 강화 학습 시스템이 실제로 분산 시스템과 유사합니다 그래서 많은 사람들이 클라우드에서 일한다고 상상해 봅니다 그들은 그 아이디어에 익숙합니다 당신의 개인적으로 잘 행동하는 시스템이 멈춘다는 것을 탠덤에서 잘 행동한다 그리고 그것은 여러 가지 이유로 꽤 흥미 롭습니다

나는 두 가지 방법이 있다고 생각한다 우리가 왜 우리 시스템이 잘못된 일을하는 것 그들 중 하나는 코드에서부터 코드를 볼 수 있습니다 일어날 일을 정확하게 이해하십시오 그리고 다른 방법은 행동에서 오는 것입니다

우리가 볼 수있는 일, 일어나는 일에 대해 생각해야만하는 곳 가설을 생성한다 로드 밸런서가이 작업을 수행하는 경우, 그러면 우리는 이것을 기대할 수 있으며, 나는이 방법으로 그것을 테스트 할 수 있습니다 어쩌면 당신은 단지 그것을 보면서 그것을 해결할 수 없습니다 로드 밸런서 코드와 서버에서 당신은 가설을 생성하고 그것을 테스트해야합니다 그리고 그것들은 두 가지 매우 별개의 단계입니다

나는 그것이 유도 적이거나 연역적이라고 생각합니다 그리고 매우 유사한 방식으로, 신경 네트워크 신경망을 개발하는 것은 똑같은 문제를 가지고있다 우리는 코드 행을 직접 가리킬 수 없다 왜 모델이 결정을 내리는가? 하지만 대신에 다음과 같은 코드를 만들었습니다 그 모델을 만들었습니다

하향식 디버깅 유형 특정 코드를 볼 수 있어야합니다 그리고 무슨 일이 일어나는지 알아 내려고 노력하십시오 그러나 이런 방식으로 보강재 학습 시스템은 실제로 많이 닮았다 분산 시스템의 그리고 디버깅은 프로세스라는 생각 가설 생성, 어떻게 가설을 검증하고 검증하는지 알았어

나는 이것을 했어 나는 이것을 기대했다 이 다른 일이 일어났습니다 – 내 직감에 대한 의미는 무엇입니까? 이 시스템이 어떻게 작동하는지? 알았어 그러니 조금 감싼다 이것의 두 가지 주요 부분이 있습니다

기계 학습 부분 및 소프트웨어 엔지니어링 부분을 포함합니다 그리고 나는이 부분에 초점을 맞추기 위해 노력하고 있습니다 어떻게 90 페타 플롭스에 도달 했습니까? 건강을 어떻게 모니터 했습니까? 어떻게 우리가 필요한 성과를 얻었습니까? 우리가 어떻게 작동하게할까요? 기본적으로 어떤 것도 건드리지 않았습니다 기계 학습 파트의 왜 네트워크는 이런 식으로합니까? 이 상수는 왜 이렇게입니까? 왜 네트워크는 이렇게 구성되어 있습니까? 그 "왜"질문, 그 사람은 꽤 힘들고, 그러나 우리가 정말로 그 소리에 대답 할 수는 없습니다 헛소리를 못하게하십시오

따라서 신경 네트워크가 있다면 기계 학습 알아 내려는 문제, 이 질문에 대한 대답, 분명히 특정 도메인이 될 것입니다 그러나 당신이 말할 때, 좋습니다, 그럼, 어떻게 배치하고 테스트 할 것인가? 이러한 응용 프로그램, 어떻게 내 가설을 테스트 할거야, 거기에 대한 답변은 구름 플랫폼되었습니다 환상적으로 작동합니다 그럼 실제로 작동 한 것들에 대해 조금 이야기 해 봅시다 잘 그래서 저는 작은 Stackdriver 대시 보드를 포함 시켰습니다

우리가 사용한 Stackdriver는 훌륭했습니다 표준 출력에 물건을 던질 수 있습니다 아무 문제없이 그들을 통해 정규식 나는 클라우드 스토리지가 레벨 이상으로 확장하는 방법을 언급했다 우리가 말한거야

그래서 우리 초기 클러스터는 아마 5 만개의 게임을 내놓았습니다 풀 사이즈 모델의 하루 TPUs를 통해 우리는 하루에 백만 개의 게임을 제공합니다 여전히 그들을 다운로드하고 다 처리해야합니다 클라우드 스토리지는 이제 막 챔피언이되었습니다

어떤 시점에서 우리는 통합을 생각하고 있습니다 Cloud Bigtable과 함께하지만 아직 미정입니다 그리고 그동안 Cloud Storage는 방금 – 우리는 단지 그것을 남용합니다 정말 훌륭합니다 내가 언급 한 Kubernetes Engine과 Cloud TPUs는, 기본적으로 상자 밖에서 작동합니다

사용에 관심이 있다면, 그것은 꽤 좋은 경험입니다 – 확실히 가입하십시오, 당신이해야 할 일 TensorBoard 19 – TensorBoard의 최신 버전 TensorBoard 대시 보드를 올바르게 제공 할 수있게 해줍니다 클라우드 스토리지에서 벗어났습니다 클라우드 TPU를 사용하려는 경우, 프로파일 링 도구는 사용하기 쉽습니다

그들은 파고 들어가는 데 유용합니다 TPU에서 최상의 성능을 얻을 수있는 방법 따라서 클라우드 스택을 사용하는 모든 부분 정말 잘 갔다 그 소리들에 관해서는, 나는 Alex Ipran에서이 인용문을 사랑한다 강화 학습은 정말로 어렵습니다

그는이 견적을 가지고 있습니다 무작위로 밝혀지면 내가 그랬는지 모르겠다 아니면 내가 방금 불행했는지 우리는 최첨단 기술에서 이러한 알고리즘을 가지고 있습니다 지금 올바르게 작동하는 기계 학습 다른 임의의 시드를 가진 버전은 솔루션에 집중하면 놀라 울 정도입니다

여기 성공적인 결과가 있습니다 그 시간의 30 % 만 작동합니다 분명히, AlphaGo Zero는 훨씬 더 견고 해 보입니다 그러나 도전의 종류를 지적한다 이 가설들을 시험 할 때, 그리고 반복 및 분리 및 정렬 가능 가설을 세우고 그들이 작동하는지 확인하십시오

이것은 정말 놀라운 견적입니다 생각하고 싶어 개인적으로 나에게 출판 된 논문의 발자취에 DeepMind가 가능한 이유를 알고 있습니다 그들의 논문을 출판했다 나를 위해 훨씬 더 어려울 것이다

좋아, 내가 상상해 보려고 그냥 상상해 보라 그들의 신발에 있었는데, 그 모델에서 예쁜 모델이 나왔습니다 좋지만 큰 것은 아닙니다 그리고 나는 나 자신에게 말한다 음

이 접근법으로 할 수있는 최선인가요? 미지의 세계를 탐험하는 것과 매우 큰 차이가 있습니다 알려진 것을 재현해라 내 경우 엔 천장에 충돌하면 그 천장과 그들이 묘사 한 천장을 비교할 수있다 말하자면, 알았어요, 분명히 버그가 있습니다 반면, 처음으로 새로운 연구를하는 누군가를 위해, 천장이라고 말하면 훨씬 더 힘들어 질거야

또는 버그가 있습니까? 부지런하고 통제 할 수 있어야합니다 당신이 격리 할 수 ​​있는지 확인하십시오 시스템의 각 부분을 확인하고 각 구성 요소가 너가 생각하는 것을하고있다 그런 종류의 의미가 있습니까? 훌륭 하네 그리고 마지막으로, 나는 인용하고 싶다

왜 내가 Go Player로 흥분하는지 이 모든 것들이 마침내 모양을 갖추게되었습니다 나는 AlphaGo 논문 다음에 Minigo를 시작했다 나는 작년의 11 월이라고 생각한다 그 이후로 페이스 북은 오픈 소스를 발표했다 번역

그들은 Tencent 모델을 방금 출시했습니다 그리고 다른 중국 기업들은 다양한 학위를 가지고 출시 한 모델 작업 개방성 그리고 이것들을 갖는 것이 매우 흥미 롭습니다 Leela Zero라는 오픈 소스 프로젝트도 있습니다 완료되었습니다

어디에서 crowdsource하려고 했습니까? 모든 GPU 컴퓨팅이 필요합니다 그리고 그것은 정말 훌륭했습니다 이 모든 사람들은 모두 재현하려고합니다 다양한 양의 성공과 함께 종이 그리고 Go Player로서 정말 멋지 네요

본질적으로 신탁에 접근 할 수 있어야합니다 Go의 게임을하는 것을 생각하는 선수들 대화를 나누면서 누군가와 대화를 나눈다 우리는 Go라는 게임을하는 위대한 속담을 가지고 있습니다 누군가와 함께 사는 것은 1 년 동안 그들과 함께 사는 것과 같습니다 그 경우에, 우리는이 새로운 것을 가지고 있습니다

그것은 우리에게 새로운 창조적 인 아이디어를 말하는 것입니다 우리가 이전에 정말로 이해하지 못했던 따라서 더 많은 것을 배우고 싶다면 Go 게임에 대해 확실히 온라인에서 확인하십시오 더 많은 리소스가 있습니다 그리고, 잘하면, 지금 배우기가 훨씬 쉬워 질 것입니다 우리는 그것을 이해할 수있는 방법이 있습니다

우리는 우리가하는 우리의 움직임에 대한 이야기를 끊으려고 노력합니다 우리가 할 일을 좀 더 쉽게 할 수 있습니다 우리가 파고 들어야 할 더 좋은 도구를 가지고 있다는 것을 이해하십시오 정말 고마워요 그들의 시간을 기부하는 데 도움을 준 여러분 께 감사드립니다

Minigo에서 일하기 그건 Tom, Seth, Brian, Josh입니다 그들 모두는 Minigo를 가능하게 만드는 도구가되었습니다 [음악 재생]

Google Translate spews doomsday messages, Facebook snatches boffins, and more in AI

Roundup 안녕하십니까, 이번 주에 AI에서 모으기에 오신 것을 환영합니다 기계는 구글 번역기에서 우리에게 유령 같은 메시지를 보내고있다

페이스 북은 새로운 실험실을 시작하기 위해 더 많은 학자를 고용하고 있으며 일부는 캘리포니아 주에서자가 운전을 시작했다 AI는 비밀스런 묵시적 메시지를 우리에게 보낸다 Google이란 무엇인가? 예수님은 최후 심판의 날이 12시에 칠 때 돌아올 것입니다 흠 이번 주, 사람들은 Google 번역에서 겉으로보기에는 무해한 단어를 번역하려고 할 때 이상한 불길한 메시지를 발견했습니다 예를 들어 "개"를 18 번 입력하고 Yoruba에서 영어로 번역하도록 설정하면 Google에서 다음과 같이 되돌려줍니다

"Doomsday Clock은 12 분에 3 분입니다 우리는 세계에서 캐릭터와 극적인 발전을 경험하고 있습니다 우리가 끝 시간과 예수님의 재림에 점점 더 다가 가고 있음을 나타냅니다 "오케이 구글

그것만이 이상한 결함이 아닙니다 단어 사이에 홀수 공백을 추가하면 Google 번역이 자연 스럽 게 나타납니다 일부 번역본은 꽤 어둡습니다 Somalian에서 영어로 "el etm ed ie"라고 번역 해달라고 요청하면 기분 나쁜 메시지가 나옵니다 "클릭하면 커집니다

구글은 자연 언어 처리를 사용하여 다른 언어로 단어를 인코딩하고 디코딩하는 AI 시스템 인 거대한 신경 기계 번역 모델을 사용하여 온라인 번역 서비스를 개편했습니다 그것은 전에 노출되지 않은 것을 생각해 낼 수 없습니다 일부 기계 번역으로 판단 할 때,이 모델에는 성서 및 유사한 자료의 구절이 공급되었을 가능성이 매우 높습니다 이것은 기독교 성경이 아마도 세계에서 가장 널리 번역 된 텍스트 중 하나이기 때문에 의미가 있습니다 따라서 풍부한 훈련 데이터가 포함되어 있습니다 다른 말로하면, 신경망이 서로 다른 언어로 된 단어를 일반적인 의미로 연결하도록하기 위해 여러 언어로 번역 된 텍스트를 사용하여 인공 지능을 교육하는 것이 좋습니다

많은 방언에서 구할 수있는이 성경은 그러한 텍스트의 상대적으로 좋은 예입니다 예를 들어 요 루바 어, 영어, 소말 리어, 영어 등의 훈련 데이터가 꽤 희소해야하기 때문에 불확실한 언어로 문제가 발생할 가능성이 더 높습니다 따라서 성경, 소설, 서적, 크롤링 된 웹 페이지 등 Google에서 사용하는 데이터 세트가 무엇이든 이름을 지정하면 기계 학습에 대한 지식이 거의 없습니다 따라서 번역하기 까다로운 구절을 제시하면 기본 교육 데이터가 전체적으로 예상치 못한 방식으로 노출 될 가능성이 있습니다 Google의 엔지니어가 아닌 누구도 이러한 신경망 뒤에 의사 결정 프로세스를 푸는 방법을 알고 있으므로 이와 같은 이상한 일들은 항상 가능하며 앞으로도 계속 발생할 것입니다 이것은 당신과 나만큼이나 오늘날의 기계 학습 관을 괴롭 혔습니다 어쨌든 구글은 번역 코드를 조정하여 분명히 소름 끼치는 부분을 분출하지 못하게합니다 – 지금은 자율 차량 사고 보고서 : GM 크루즈는 보행자가 적색 신호등에서 차량을 테스트 한 후 캘리포니아의 DMV에 최근에 보고서를 제출했습니다

이 보고서 중 어떤 것이 보일지는 흥미로운 일입니다 고맙게도 아무도 다쳤습니다 "자율 모드에서 운행하는 크루즈 자율 주행 차량 (Cruise AV)은 Sansome Street 교차로의 Sutter Street 서쪽에있는 사건에 참여했습니다 Jaywalking 보행자가 Cruise AV에 접근하여 의도적으로 차량 후드 위로 올라갔습니다 크루즈 AV는 붉은 빛으로 멈췄으며 후드가 움푹 패였습니다

보행자가 발을 딛고 걸어 나갔다 부상자는 없었고 경찰은 전화를받지 않았다 "고 보도했다 페이스 북을위한 새로운 로봇 연구소 : 페이스 북 : 페이스 북은 페이스 북을 위해 로보틱스를 포함한 연구 허브를 열도록 소셜 미디어 거물과 합류하는 새로운 학계의 라운드를 발표했다 Carnegie Mellon University의 로봇 공학 교수 Jessica Hodgins는 학계와 피츠버그에있는 새로운 Facebook AI Research 연구소를 이끌며 시간을 나눌 것입니다 그녀는 또한 카네기 멜론 (Carnegie Mellon)의 로봇 공학 교수 인 Abhinav Gupta 소셜 미디어 플랫폼이 실제 로봇에 관심을 갖는 이유는 분명하지 않습니다

그러나이 팀은 "수년간 지속적으로 학습하는 평생 학습 시스템, 로봇을 추론하기, 인공 지능을 지원하기위한 AI"에 초점을 맞출 예정이다 학계의 다른 고용인은 Luke Zettlemoyer (시애틀의 FAIR 연구소에 합류 한 워싱턴 대학교 자연 언어 처리 담당 교수) Andrea Vedaldi, Oxford 대학의 부교수이자 Jitendra Malik은 런던과 Palo Alto에서 FAIR에 대한 컴퓨터 비전 연구를 수행합니다 OpenAI, 새로운 Dota 도전 시작 : OpenAI는 OpenAI Five 봇으로 전직 전문 Dota 플레이어와 싸울 또 다른 경쟁을 발표했습니다 OpenAI는 도전의 어려움을 서서히 증가시키고 있습니다 처음에는 1 대 1 게임에서 서로 대결 한 모든 영웅이 동일해야만하는 미러 경기였습니다

지난 달 OpenAI Five는 5V5 미러 매치에서 우승했습니다 이제 OpenAI는 제한이 적은 세미 프로에 직면하기를 원합니다 선택할 수있는 영웅 18 명과 미러가 일치하지 않는 영웅이 있습니다 디바인 레이피어 (Divine Rapier)와 보틀 (Bottle)과 같은 일부 아이템은 여전히 ​​금지되어 있으며, 봇은 주변의 적을 탐지 할 수있는 스캔 (Scan)을 사용하지 않을 것입니다 봇의 반응 시간도 80ms에서 200ms로 증가하여 이점이 적습니다 그러나 그들은 한 번에 전체 전체지도를 볼 수있는 엄청난 이점을 누릴 수있는 것처럼 보입니다

지도를 중심으로 수동으로 영웅을 움직여야하므로 인간이 할 수없는 무언가가 있습니다 경쟁은 8 월 5 일 OpenAI의 샌프란시스코 사무소에서 열릴 예정입니다 OpenAI org는 Glow라고하는 reversible generative model을 발표했습니다 여기에는 오픈 소스 코드가 들어 있습니다 예를 들어, 얼굴 사진에서 웃음, 나이의 징후, 눈 크기 및 머리 색깔을 조정할 때 사용할 수 있습니다

미국의 FPGA, 중국의 AI 칩 출시를 앞당긴다 FPGA로 유명한 하드웨어 회사 인 자일링스가 DeepPhi Tech를 인수했다 인수의 재무 세부 사항은 공개되지 않았습니다 두 회사는 잠시 동안 긴밀한 협력 관계를 유지해 왔으며, DeepPhi는 자일링스와 파트너 관계를 맺어 FPGA 칩을 조정하여 신경 네트워크의 훈련 및 추론 단계를 가속화했다 "FPGA 기반의 심층 학습 가속기가 대부분의 요구 사항을 충족합니다

"Yao는 이전에 자매 사이트 인 The Next Platform "그들은 수용 가능한 성능과 성능을 가지고 있으며, 맞춤형 아키텍처를 지원하고 온칩 메모리 대역폭이 높으며 신뢰성이 매우 뛰어납니다 "DeepPhi는 자연 언어 처리 및 컴퓨터 비전 작업을 위해 장시간 단기 메모리 네트워크 및 길쌈 신경 네트워크 최적화에 집중하기를 원합니다 자세한 내용은 여기를 참조하십시오 ®

How to Leverage AI to Combat Fraud and Abuse

안녕하세요, 저는 Bolt의 Emily Yeh입니다 안녕하세요, 저는 Google AI의 Yewande Alade입니다

저는 IBM Watson의 Allie Miller입니다 우리는 AI가 어떻게 활용 될 수 있는지에 대해 이야기 할 것입니다 사기와 싸우기 AI는 소비자를위한 Siri에서 기업용 Watson에 이르기까지 모든 산업을 접하기 시작했습니다 이것은 우리가 진보를 만들 수 있지만 큰 위험에 빠지게합니다

AI가 더 똑똑하고 강력해질수록 진실을 속이는 것이 더 쉬워집니다 AI는 차세대 사기성 및 폭력적인 활동을 강화하기 시작했으며, 이러한 기술을 사용하는 것은 우리의 책임이자 능력입니다 자신과 미래를 보호하기 위해 산업 – 금융에서 농업, 상거래에서 보험에 이르기까지 – 우리는 다음 10 년 동안 보게 될 것입니다 그 사기 예방 및 사기 탐지가 가능한 가장 중요한 브랜드 부분 시장에 대한 신뢰와 투명성을 구축합니다 따라서 신생 기업의 제품 전문가로부터 배우십시오 IBM Watson 및 Google AI와 같은 회사 보다 강력하고 신뢰할 수있는 제품을 구축하는 방법을 배우십시오

적용된 기계 학습 방법을 사용하는 동안 긴급한 위험 동향에 대해 논의하겠습니다 귀하가 취할 수있는 적극적인 조치 그들을 확인하고 고칠 수 있습니다 따라서 우리는 SXSW에서 AI 패널을 통해 우리가 투표하고 최초의 여성을 창립하기를 바랍니다