Music and Machine Learning (Google I/O'19)

[GOOGLE LOGO MUSIC] JESSE ENGEL : 저는 제시입니다 ADAM ROBERTS : 저는 아담입니다

JESSE ENGEL : 그리고 우리는 – 덕분에 Google은 Google 내의 프로젝트에서 왔습니다 프로젝트 마젠타 (Project Magenta) 그것은 Google 내의 기계 학습 그룹의 일부입니다 그리고 우리는 구체적으로 – 그것은 오픈 소스 연구 프로젝트입니다 그래서 우리는 최첨단 기계 학습 연구를하고 있습니다

하지만 우리는 그 역할에 정말로 관심이 있습니다 그 기계 학습은 창조적 인 기술을 위해 놀 수있다 예술가와 음악가를 위해 그래서 우리가하는 모든 일을 오픈 소스에 내 놓습니다 또한 개발자를위한 도구를 만드는 데 중점을 둡니다

예술가들이 실제로 탐험 할 수 있도록 창조적 인 과정에서 인공 지능과 기계 학습을 사용합니다 그리고 프로젝트에 더 많은 관심이 있다면, 그냥 진짜 빠른 플러그 gco/magenta로 갈 수 있습니다 당신이 연구면에서 더 많이한다면, 당신은 모든 종류의 연구 논문과 데이터 세트를 찾을 수 있습니다

음악인이라면 많은 통합 도구가 있습니다 당신은 시도 할 수 있습니다 그리고 다른 라이브러리에도 JavaScript가 있습니다 코더에 사용할 수 있습니다 그래서 저는 그것을 아담에게 넘겨 줄 것입니다

누가 실제로 이것이 더 의미하는지에 대해 이야기 할 것입니다 ADAM ROBERTS : 네 한 가지 구체적인 예를 살펴 보겠습니다 우리가하는 일의 유형 이것은 단지 – 우리가 풀어 놓은 프로젝트입니다

지난 주에 그루브라고 불렀어 실제로 초대하기 만하면 실제로 시작되었습니다 드러머, 전문 드러머 고용 사무실에 와서 우리는 전자 드럼 킷을 사용하여 우리가 상징적 표현을 포착 할 수있게했다 그들의 공연 중

그리고 우리는 기계 학습 모델을 훈련 시켰습니다 우리가 생각한이 데이터로 다양한 작업을 수행합니다 창의적인 맥락에서 사용하는 것이 흥미로울 수 있습니다 그래서 나는 잠시 후에 그 일들 중 일부에 빠지게 될 것입니다 하지만 우선, 나는 우리가 실제로 어떻게 움직이는 지 살펴보고 싶다

이 물건들을 세상에 뿌려 라 먼저, 우리는 연구 그룹입니다 그래서 우리는 학술 논문을 씁니다 우리는 기계 학습 회의에 제출합니다 우리는 또한 데이터 세트를 공개함으로써 다른 연구자들이 그것을 취하고 결과를 재현하거나 또는 잘하면 그것을 확장, 그것을 향상시킬 수 있습니다

그러나 우리는 또한 항상 우리 물건을 오픈 소스에 넣습니다 그래서 우리는 코더들이이 기술에 접근 할 수 있기를 바랍니다 그래서 우리 모델의 TensorFlow 구현을 릴리스 할 것입니다 우리는 또한 일반적으로, 그리고이 경우, 우리는 TensorFlow JS에서 다시 구현했습니다 그리고 이것은 단지 유용한 기술입니다

인터페이스 및 응용 프로그램 구축 용 이러한 방법들 위에 그것은 정말 쉽습니다 당신은 자바 스크립트에 넣습니다 그리고 마지막으로,이 경우, 우리는 데이터 세트를 TensorFlow 데이터 세트에 넣습니다 해당 데이터 세트에 액세스하기위한 단일 라인 API와 같습니다

그래서 당신은 새로운 모델을 훈련시킬 수 있거나 그것을 사용할 수 있습니다 네가 원하는 어떤 목적이든 그리고 마지막으로, 우리는 일반적으로 어떤 종류의 음악가 또는 예술가를위한 도구, 또는 우리가 목표로하는 제작자 유형에 상관없이 이 경우 자바 스크립트 구현을 사용했습니다 우리는 Ableton을 위해 magenta / studio라는 플러그인을 만들었습니다 살고 있다

따라서 Ableton Live에 익숙하지 않은 경우, 전문 소프트웨어 패키지 사람들이 음악을 제작하거나 음악을 작곡하는 데 사용합니다 그리고 이러한 플러그인은 새로운 기능을 추가합니다 전에 존재하지 않았던 그 도서관에 그래서 나는 Drumify에 집중하고 싶습니다 우리가 모델에서 만든 두 개의 플러그인 중 하나 인 그룹 데이터 세트로 만들었습니다

그리고이 플러그인이 실제로하는 일은 실제로 어떤 종류의 리듬 음악을들을 수있게 해줍니다 드럼 비트로 변환하거나 드럼 비트를 생성합니다 종류가 잘 동반됩니다 그래서 당신이 프로듀서라고 상상해보십시오 새 노래 시작 중입니다

그리고 당신은 많은 것을 좋아하는베이스 라인을 가지고 있습니다 하지만 드럼 킷에 접근 할 수 없거나 또는 당신은 재능있는 또는 숙련 된 드러머가 아닙니다 Drumify 플러그인을 사용하여베이스 라인을 사용할 수 있습니다 계속하기 위해 동반하는 드럼 비트 만들기 당신의 구성 과정 그럼 실제로이 간단한 예를 들어 보겠습니다 먼저 누군가가 만든베이스 라인을 듣게 될 것입니다

[베이스 라인 연주] 이제 우리는 그것을 취할 것이고 우리는 Drumify와 동반 할 드럼 비트로 바꿀 것입니다 [마약 사용으로베이스 라인] [웃음] [박수 갈채] 그래서 그것은베이스 라인, 저음의 온셋을 사용하는 것입니다 그 리듬을 추출하는 메모 몇 번의 클릭만으로 그것을 따라갈 드럼 비트를 만들 수 있습니다 이것이 유형의 한 가지 예일뿐입니다

우리가 작업하고있는 것들 더 많은 gco/magenta가 있습니다 우리에게는 훨씬 더 많은 프로젝트가 있습니다 모든 것은 무료이며 오픈 소스이며 사용하기 쉽습니다

그러니 관심이 있다면 확인해보십시오 그러나 이제 우리는 전환하고 약간 초점을 맞추고 싶습니다 실제로 만든 일부 제작자에게 이 기술과 예술적 실천을 사용하기 시작했습니다 그래서, 구체적으로 오늘 우리는 두 명의 음악가가 있습니다 우리는 정말로 흥분하고 있습니다

첫 번째는 Claire Evans입니다 그래서 그녀는 YACHT 밴드의 삼분의 일입니다 그녀는 또한 예술가이기도합니다 완성 된 저자 그녀의 책은 "광대역 – 인터넷을 만든 여성들의 이야기를 풀어 라

" 그리고 나는이 책을 매우 추천한다 네 [박수 갈채] 나는 그것이 독서가 필요하다고 생각한다 그래서 확실히 확인해보십시오 그러나 오늘 그녀는 그것에 대해 이야기하지 않을 것입니다

그녀는 최근 밴드의 모습을 이야기 할 것입니다 일부 기계 학습 기술을 채택했습니다 그들의 과정에서 그리고 그 밴드가 밴드로 데려가는 모습을 볼 수 있습니다 그러니 클레어를 무대에 초대하십시오

CLAIRE EVANS : 고마워 안녕하세요 안녕, 모두들 안녕하세요, 저는 분명히 클레어입니다 그리고 저는 여기 밴드의 대표자입니다

그래, 오늘 밤 우리 메인 스테이지에서 연주하고있어 그래서 당신이 이것을 좋아한다면,이 흥미로운 것을 발견한다면, 우리는 많은 노래를 연주 할 것입니다 오늘 내가 메인 스테이지에서 이야기하고있는 것입니다 그래서, 요트에 익숙하지 않은 사람을 위해, 나는 이것을 빠른 서언으로 시작하려고한다 그래서 당신은 우리가 누구인지 그리고 어디서 왔는지에 대한 감각을 얻습니다

우리는 내가 어떻게 시작하는지부터 시작합니다 우리는 기계 학습에 들어갑니다 그래서 요트는 2002 년에 제 파트너 인 Jona Bechtolt에 의해 설립되었습니다 누가 저기 앉아 있니? 이런 종류의 낡아 빠진 이름을 따서 명명되었습니다 그가 오레곤 주 포틀랜드에있는 거리에서 본 사인 – YACHT, 최첨단 기술을 도전하는 젊은 미국인

우리는이 사업이 무엇을했는지 전혀 모른다 실제로는 솔직히 Google을 사용할 수 없습니다 어떤 것들은 있습니다 우리는 수년 동안 여러 번 찾아 내려고 노력했습니다 그러나 우리는 많은 다른 화신을 가지고 있었지만 밴드의 17 년 동안 음악을 만들었습니다

우리는이 두문자어를 지켰습니다 그것은 뭔가 실제로 명료하게 표현하기 때문에 우리가 누구인지에 대한 핵심입니다 끊임없이 기술과 대화를 나누고 싶습니다 내 말은, 분명히 우리가 여기 있기 때문에 우리는 러 다이 트가 아니란 말입니다 그리고 우리는 특별히 적대적이지 않습니다

그 의미에서 도전적입니다 우리는 항상 약혼을 유지하고 싶습니다 그리고 우리는 항상 푸시의 종류를 알고 싶어합니다 도구를 사용하거나 작업에 영향을 미침 우리가 사용하는 도구들, 우리의 작업을 형성하는 도구들 나는 내가 코더가 아니라고 말하고 싶다

나는 아담과 제시가 짝을 이루는 것의 20 % 만 이해했다 지금 말하자면 우리는 그들과 함께 일해 왔습니다 삼년 동안 그래서 우리의 기술과의 관계 예술을 만드는 맥락에서 항상 그렇습니다 밖을보고에서 왔습니다

우리는 도구에 대한 접근과 접근에 관심이 있습니다 흥미로운 도구로, 그리고 우리 자신의 소설을 찾는 것 도구를 사용하는 방법, 옆에있는 일종의 방법 우리는 창조적 인 응용을 강요하고 싶습니다 비 크리에이티브 기술자의 우리가 그들과 함께 할 수있는 것을보기 위해 비 소비자 지향적입니다 어떻게 그들이 우리의 역사적으로 예쁜 것에 적용될 수 있는지보십시오

DIY, 펑크 록 작업 기본 기본 지시문이 하나 있다면 우리가하는 일을 지배하고, 가능한 한 많이해야한다 가능한 한 작은 것으로, 어떤 것이 있습니다 우리가 Buckminster Fuller를 많이 읽음으로써 우리 자신의 배경에 필연적 인 유추를 그려야한다 태평양의 분산 형 펑크 록 커뮤니티에서 북서

나는 너에게 한 쌍에 대해 말할거야 당신이 우리가 누구인지에 대한 감각을주기 위해 우리가 한 프로젝트의 그래서 몇 년 전에 우리는 새 앨범 표지를 공개했습니다 독점적으로 팩스를 통한 삽화 우리는 웹 애플리케이션을 구축하여이를 수행했습니다 인근 팩스 기기를 FedEx와 같은 팬들에게 제공하십시오

또는 UPS 또는 그 부모의 사무실에 직접 제출하고 직접 작품을 보냈습니다 표지 문을 덧붙여 그들에게 팩스 기계가 정보를 전송합니다 이는 기본적으로 음악이하는 것입니다 그리고 우리는 활성화의 아이디어를 좋아했습니다

휴면 기술 또는 잠재 기술, 어떤 창조적 인 가능성이 존재하는지 보여주는 방법으로 노후화의 위기에 처해있다 그리고 그 단계에서 우리는 최근에 4 년짜리 프로젝트 정말로 휴면 한 기술을 재 활성화하는 것 로스 앤젤레스 시내, 1975 년 공개 미술 작품 원래 "Triforium"이라고 불리는 세계 최초의 폴리포옵 틱 (polyphonoptic) 빛과 소리를 동기화시킬 수있는 도구 원래의 새로운 예술 형식으로 그것이 1975 년에 지어 졌던 컴퓨터 시스템은, 분명히, 스너프까지는 아니었다 그래서 그것은 매우 오랜 시간 동안 부러졌습니다 하지만 우리는 돈이 있고, 학제 간 팀이 있습니다 함께 빛을 되찾았습니다

맞춤형 LED 설치를 사용합니다 그리고 우리는 원래의 8 비트 종이 테이프를 구제 할 수있었습니다 원래 컴퓨터를 실행 한 코드 시스템을 통해 실시간으로 응답 할 수 있습니다 다시 한번 음악 입력 그래서, 다시, 이것은 공동 거주입니다

구약과 신기술의 우리는 사물을 사용하는 것을 좋아합니다 다시 탐험하고 다시 상상하기를 기다리고, 또 다시, 가능한 적은 자원으로 우리는 기계에 정말로 관심이되었습니다 약 4 년 전에 학습했습니다 우리가 그럴 것 같았 기 때문에 아마 우리를위한 다음 단계 일 것입니다 우리는 기계의 반사 특성 그것을 배우는 방식처럼 우리가 자신을 이해하는 데 도움이되고 생성적인 자질 기계 학습, 그것이 우리를 도울 수있는 방법 완전히 새로운 것을 만들기 위해서

기본적으로 꼬리말부터 말하고 있습니다 기계를 찾으려는 1 년 동안의 긴 프로젝트 일할 수있는 학습 주도적 구성 과정 우리의 목적을 위해, 그것은 우리가 음악을 만들 수있게 해줄 것입니다 인간이 음악을 만들어내는 것만 큼 단순한 것이 아니 었습니다 그러나 진정으로 흥미롭고 의미있는 것으로 그리고 녹음의 우리 뒤의 목록과 일치하여 그래서 우리는 단지 레코드를 만들고 싶지 않았습니다

기계 학습 기계 학습을 사용하여 YACHT 레코드를 만들고 싶었습니다 그리고 그것은 다른 제안입니다 나는 변덕에 빠지게 될거야 그게 테마라고 생각하기 때문에

이것은 기본적으로 우리가 기록에 사용했던 것입니다 우리는 다양한 전략을 가지고 실험했습니다 그러나 우리는 우리를위한 최고의 구성 도구가 Magenta의 MusicVAE 모델은 잠재 공간입니다 보간 모델은 우리가 본질적으로, 나는 이것이 기술적 인 설명 방식이 아니라는 것을 안다 하지만 그건 우리가 멜로디를 찾을 수있게 해줬 어

우리 자신의 등 카탈로그에서 노래들 사이에 숨어 있습니다 그리고 이것은 사용자가 그 모델을 바라 보는 부분입니다 우리가 처음에는 지난 5 월 기록을 남겼다 그것은 CO 실험실 노트북이다, 그래서 정확하게 종류 뮤지션의 음악은 스튜디오에 데려 오는 데 익숙합니다 불행히도 우리는이 작업을 시작했습니다 Magenta가 사용자 친화적 인 Ableton Live를 만들기 전에 뮤지션을위한 플러그인

하지만 알다시피, 그것은 무엇이든간에 – 그것은 우리에게 거리를 제공합니다 그래서 나는 그것으로 괜찮습니다 그래서 이런 식으로 일하기 위해서는 CO 연구실과 같은 것을 가져와야합니다 노트북을 스튜디오에 가져 가면 많은 준비 작업을해야합니다 먼저, 전체 카탈로그에 수동으로 주석을 달았습니다

82 곡 이요 MIDI로 그리고 우리는 모든베이스 라인을 깨뜨 렸습니다 보컬 멜로디, 키보드 라인, 드럼 파트를 4 개의 바 루프로 구성합니다 그런 다음 CO 랩 노트북을 통해 이러한 루프 쌍을 실행했습니다 다른 온도에서 때때로 수십 번, 수백 번이 아니라도 이 거대한 몸을 생성하기 위해서 우리가 할 수있는 멜로디 정보 새로운 노래를 만들기위한 소스 자료의 일종으로 사용하십시오

우리가이 엄청난 양의 음악 정보를 가지고있을 때, 인간의 과정이 시작된 때입니다 이것은 우리가 수동으로 모두를 통해 컬링을 시작한 때입니다 재미있는 순간을 찾으려고 노력하는이 MIDI 데이터의 우리에게 말한 것들, 재미 있다고 느낀 것들, 우리가 더 탐험하고 싶었던 것들 여러분 중 일부는 알 수 있듯이 기계 학습을 사용합니다 시작, 중간, 그리고 끝, 운문, 합창, 운문으로, 조금 아직도, 우리의 범위 밖

멜로디가 모델의 직업이기 때문에 그것은 좋은 일입니다 그러나 배치와 성능 전적으로 우리 일 이었어 제가 좀 더 구체적으로 의미하는 바를 증명하기 위해, 하나의 노래에서 단 하나의 멜로디에 집중하겠습니다 그래서 나는 너에게 멜로디를 연주 할거야 곧바로 MusicVAE 모델에서 빠져 나옵니다

그것은 생성 된 몇 가지 다른 MIDI 시퀀스 중 하나였습니다 2 개의 다른 YACHT 노래 사이 보간법에 의하여, 하나는 "홀로그램"이고 하나는 제목에 맹목적인 말을하고있어 아마 나는 소리내어 말하면 안돼 관객 : 말해봐! [메트로놈 연주가있는 멜로디 한 곡] 클레어 에반스 : "나는 죽을 때까지 너와 섹스하고 싶어" [LAUGHS] 승인 그래서 우리를위한이 특히 멜로디 예외적으로 미학적으로 흥미 롭습니다

그러나 MusicVAE 모델에 의해 생성 된 모든 멜로디와 마찬가지로, 끝없는 메모의 순서입니다 멈출 때까지 계속 켜져 있습니다 그것은 정확히 대중 음악이 아닙니다 그래서 이것이 규칙이 들어오는 곳입니다 그리고 나는 기술적 인 규칙을 의미하지는 않습니다

나는 인간의 규칙, 우리의 특정한 과정을위한 일하는 규칙을 의미한다 우리는 항상 번창했습니다 많은 예술가들처럼, 저는 믿습니다 스스로 부과 된 제약 하에서 왜냐하면 당신이 앉아서 팝을 쓸 때 세계의 모든 것에 관한 노래, 그것은 압도적입니다

그러나 당신이 그 자리에 약간의 경계를 가지고 있다면, 당신은 그것에 대해 더 구체적으로 생각할 수 있습니다 그래서 우리를 위해 우리는 우리가하는 모든 노래가 이 과정으로 만들려고한다 기존의 것으로 보간되어야했다 멜로디를 다시 카탈로그에서 우리는 이것이 노래로 이어질 것이라고 기대했습니다

그런 종류의 요정이 있었어 느낌, 우리는 양을 정하는 방법을 모른다 나는 모델도 할 수 있다고 생각하지 않는다 그러나 이것이 우리가 결정할 매개 변수입니다 우리는 또한 메모를 추가 할 수 없다고 결정했습니다

우리는 하모니를 추가 할 수 없었습니다 우리는 잼이나 즉흥 연주를 할 수 없었습니다 해석하거나 본질적으로 어떤 방식 으로든 창조적이어야합니다 첨가제 변경은 없었고, 감산 만 또는 전치 변화 그래서 우리는 어떤 악기에도 멜로디를 지정할 수 있습니다

우리가 방금 들었던 멜로디가 키보드 였을 수도 있습니다 라인,베이스 라인이었을 수도 있고, 기타 라인 일 수도 있었고, 보컬 멜로디 일 수도 있었어 그것이 우리의 결정이었습니다 우리는 멜로디를 작업 키로 바꿀 수 있습니다 그리고 구조화하고 자르고 콜라주 할 수 있습니다

우리가 원하는만큼 이제 또 다른 중요한 요소 인 가사에 대해 이야기하겠습니다 어떤 노래 든 그래서이 프로젝트를 위해 우리는 다른 창의적인 기술자 인 로스 굿윈 (Ross Goodwin) 우리가 그와 함께 일하기 시작했을 때 그는 자유 계약자였습니다 그는 현재 Google의 아티스트 및 컴퓨터 인텔리전스를 사용 중입니다

그룹, 많은 일이 일어난 것입니다 우리 과정에서 우리는 Ross와 함께 가사 모델을 만들었습니다 우리의 멜로디 모델과 같은 종류의 정신으로 그래서 우리는 그것이 일종의 우리 자신의 영감을 반영하여, 우리 자신의 배경, 우리 자신의 역사, 우리 자신의 백 카탈로그

그래서 우리가 Ross로 만든 모델 20 메가 바이트의 텍스트로 된 코퍼스에서 훈련 받았다 약 500,000 페이지 또는 약 2 백만 페이지입니다 말 그리고 이것들은 모두 우리가 우리의 영향으로 여겨지는 음악, 우리가 듣고 자란 음악, 우리 부모님의 음악, 우리 자신의 음악, 우리 친구, 공동 작업자 및 동료 우리는 이것을 기계의 종류를 가르치는 기회로 보았습니다

우리의 가치, 역사, 우리 공동체, 그리고 어디에서 우리는 예술가로서 왔습니다 최종 결과는 이것이었다 따라서 하나의 인스턴스, 하나의 블록 Ross가 우리와 함께 만든 가사 모델의 출력 결과 한 장의 도트에 인쇄했습니다 매트릭스 프린터 용지

왜냐하면, 당신도 알다시피 그들은 여전히 ​​도트 매트릭스 프린터를 만듭니다 아마존에서 살 수 있습니다 그리고 우리는 그것을 실제로 물리적 인 것으로 시각화하고 싶었습니다 그래서 우리는이 방대한 텍스트 블록을 가지고있었습니다 우리가 스튜디오에 가져온 하나의 연속 시트 우리와 함께

그리고 나는 말 그대로 스튜디오 층에 앉아 있었고, 재미있는 구절을 강조 표시합니다 그것이 포함되어있어서 흥미 롭습니다 저온에서 고온의 물질 범위 저온 물질은 위험이 적기 때문에, 훨씬 더 단순하고 훨씬 반복적입니다 그것은 펑크 록 가사 엔진의 일종입니다

노래에서 더 많은 요소적인 것들을 두 드린다 전체 페이지와 페이지 및 페이지가 있습니다 반복적 인 어구들처럼, 나는 너의 두뇌를 원해 또는 나는 바위를 피우려고합니다 아니면 당신을 사랑합니다

저온 소재입니다 그리고 나서 고온 재료 문장에 무의미한 행동이 가득하다 그리고 정말 이상한 고유 명사와 사물의 이름이 많이 있습니다 그래서 노래를 만들려면 정서적으로 다양한 감정을 가지고 있었고, 우리는 많은 저온 고온 재료를 같은 노래에 담았습니다 그리고 멜로디와 마찬가지로, 우리는 그대로의 것을 가져 가지 않았습니다

우리는 실제로 수동으로 샅샅이 뒤지며 예외적으로 흥미로운 문구 나 이미지를 찾았습니다 또는 구절, 또는 우리에게 말한 것들 우리가 누구인지에 대해 의미있는 것처럼 느껴졌습니다 그리고 우리가 어디에서 왔는지 텍스트를 사용한 작업 방식에 가장 큰 영향 정말 저급 기술, 반 기술, 정말 윌리엄 S 버로우스가 잘린 걸 봤어

작문 방법과 다다 이스트 첨단 기술, 낮은 기술은 우리의 operandus의 일종입니다 그래서 실제로 노래를 만들려면 거대한 텍스트 블록과이 거대한 더미 멜로디의 우리는 실제로 재미있는 구절을 가져 가야했다 멜로디 위에 올려 놓으십시오 우리가 결정한 것은 흥미로운 보컬 멜로디가 될 것입니다

문제는 VAE에서 생성 된 멜로디입니다 인체와 관계가 없다 우리 인체 나 역량에 출연자와 가수로서 그리고 그들은 확실히 관계가 없습니다 영어의 내부 리듬에 이르기까지

그래서 우리가 위에 가사를 깰 시간이 많이 있었어 멜로디를 일종의 강제로 작업하기 위해 그리고 그것은 우리가 음절을 떼어 내고 발음해야한다는 것을 의미했습니다 정말 이상한 방법으로 일을하고 일을해라 깊이 직관력이 없었고 이 음악을 듣는 많은 사람들을 이끌어 낸다 가사를 끊임없이 잘못 들었다

그것은 마치 [INAUDIBLE] 메이커와 같습니다 그럼 좀 더 자세히 살펴 보겠습니다 우리가 함께하기로 결심 한 가사들 여기 노래의 한 구절이 있습니다 "나는 내 두뇌에 당신의 전화를 원한다

내 이름을 부르면 좋겠어 네가 그걸 해주기를 바란다 오, 오지 않을 래? 오지 않을거야? 내 머리 속에서 일하지 않니, 내 번호 9 이니? 살아 있기 위해서, 너와 함께, 잡초처럼 나는 침대에서 개처럼 머리에서 느낄 수있다 " 알아

[박수 갈채] 따라서 일반적으로 노래를 쓰는 사람으로 말하면 의미 나 종지와 관계가있다 또는 어떤면에서 개인적으로, 이런 종류의 가사를 부른다 내 구현 된 습관을 벗어나서 강요했다 먼저 단어와 소리 사이의 관계를 발전 시키십시오 그리고 그 의미를 사랑하고 감사하게 성장하십시오

소리가 난다 그것은 꽤 해방이야 그러나 가사에는 또한이 정말로 강한, 나는 결코 쓰지 않을 것 인 이상한 이미지 마찬가지로, "나는 침대에서 개처럼 머리에서 느낄 수 있습니다" 내 말은, 어구 야

그것은 관용적 인 영어의 형태입니다 그러나 의미는 완전히 옆으로입니다 그럼에도 불구하고 그것은 여전히 ​​뭔가 의미가 있습니다 왜냐하면 우리 모두가 쉽게 할 수 있다고 생각하기 때문입니다 따뜻하고 고의적 인 느낌을 상상해 보라

그리고 밤에 잠들고있는 개처럼 선물한다 그리고 그것은이 물건들을 다루는 마법입니다 언어에 대한 새로운 사고 방식을 열어줍니다 음악에 대해 생각하고 상호 작용을 생각하는 것 그 두 가지 사이 승인

그래서이 가사들이 어떻게 그 멜로디에 잘 들어 맞는지 들어 봅시다 내가 방금 연주 한 곡은 처음에 결정 했어 좋은 보컬 멜로디가 될 것입니다 [메트로놈과 음악 재생] [LAUGHS] [박수 갈채] 감사 그래서 가장 흥미롭고 도전적인 것들 중 하나입니다

이런 식으로 일하는 것은 실제로 생성 재료를 수행하는 단계 앞서 말한 것처럼, 그것은 종종 우리의 역량을 훨씬 뛰어 넘습니다 그리고 때로는 단순하게 들리는 것들 – 내 말은, 이것은 간단하게 들리지만 옆길과 같습니다 연극과 공연의 구체화 된 패턴으로부터 우리가 익숙한거야 몇 번이나 말해 줄 수 없어요

우리는 단지 꼼꼼하게 꼼꼼하게 찍으려는 스튜디오에 있습니다 간단한 기타 라인 그러나 그것이 단지 약간 다른 이유만으로 우리는하는 것에 익숙했습니다 불가능했습니다 그리고 그것은 많이 일어났습니다

그리고 그것은 두뇌의 종류였습니다 많은 순간에 어렵다 그러나 동시에, 종종 강제로 우리를 우리의 안락 지대 밖으로 밀고, 우리를 밀었습니다 우리가 빠졌던 패턴의 바깥쪽에, 종종 우리가 인식하지 못했던 패턴들 거기에 처음부터 있었다 그리고 그것은 우리가 다르게 게임을하도록 강요했습니다

우리가 일하는 방식에 대해 다르게 생각하십시오 승인 마지막으로, 나는 마지막 노래의 첫 번째 분을 연주하고 싶다 모든 것을 함께 그래서 첫 번째 합창을들을 겁니다

놀랍고 독특한 이디엄을 가지고 있습니다 그리고 내가 전에 연주 한 구절을들을거야 다시 한 번, 멜로디 적으로, 당신이 듣는 모든 것 MusicVAE 모델에 의해 생성되었습니다 그러나 성능, 배치, 생산, 구조, 그 외 모든 것은 우리 것입니다 그리고 이것은 우리가 공동의 전략으로 보는 것입니다

예술가처럼 그렇게 많은 것은 아닙니다 기계 학습으로 대체되고, 오히려 기회가 주어진다 우리의 에너지를 다른 방향으로 집중시키는 것 우리가 익숙하지 않은 다른 곳에서 통제권을 철회하는 것이 아닙니다 그것은시키는 것이 아닙니다

그것은 유지하고 프로세스가 당신을 바꾸게하는 것입니다 아마도 펌프질 할거야 [음악 재생] 진짜 노래 같아! 그래서 분명히 이것은 단지 하나의 방법 일뿐입니다 음악을 만드는 기계 학습과 협력하는 것 그리고 심지어 옳은 길조차도 아닙니다

나는 생각하지 않습니다 무수한 접근법이 있습니다 그리고 그들 중 많은 사람들이 훨씬 더 기술적 일 것입니다 다시, 우리는 우리가 어디에 들어갈 수 있는지 들어 있습니다 우리는 우리가 알고있는 수준에 종사하고 있습니다

그러나 그것이 직면하고있는 도전, 그것이 워크 플로우로 가져 오는 이유는 분명히 아닙니다 직관적 인 또는 재미있는 브라우저에서 CO 랩 노트북을 당겨서, 스튜디오에서 도전 과제는 정말 만족스럽고 흥미 롭습니다 그들이 도전의 종류이기 때문에 그것은 당신이 실제로하고있는 것을 멈추고 고려하게 만듭니다 그리고 우리에게는이 과정이 때때로 격노하고 있습니다 그러나 궁극적으로, 정말 깊이 기뻐하고 있습니다

내가 설명 할 수있는 가장 좋은 방법이야 당신이 퍼즐을하고있는 것처럼 느껴지는 것입니다 그리고 당신이 끝나면, 퍼즐에있는 그림 상자에있는 것이 아닙니다 하지만 누가 신경 쓰냐? 상자에 무엇이 있는지 누가 알기 때문에? 승인 더 많은 이야기가 있습니다

패널에서 이야기 할 수 있습니다 고맙습니다 [박수 갈채] JESSE ENGEL : 정말 대단합니다 시원한 네

너 여기 앉아있어 네 그래서 우리는 YACHT에게와 주셔서 정말 감사드립니다 그래서이 과정의 초기에 당신은 우리의 도구가 많이 있다는 것을 알 수 있기 때문에, 당신의 이야기를 통해, 초기 단계에 그냥 일종의

그리고 우리는 많은 유용한 피드백을 받았습니다 예술가가 실제로 어떻게 다른 유형의 것들과 상호 작용하기를 원한다 기계 학습에서 그리고이 다음 프로젝트에서는 우리가이 과정에 어떻게 왔는지 보여주는 일종의 느낌 지금이 도구들을 사용할 수있게 해줍니다 누군가가 더 짧은 시간에 프로젝트를 수행 할 수있는 곳 시간

그래서 우리는 불타는 입술로 프로젝트를했습니다 그것은 매우 구체적입니다 관객 : 우! ADAM ROBERTS : – 그게 I / O를위한 것입니다 그래서 우리는 당신에게 사물의 피크를 줄 것입니다 오늘 밤 콘서트가있을거야

그리고 우리는 여기서 훌륭한 토론 패널을 갖게 될 것입니다 이 모든 것에 대해 이야기하기 그래서 우리는 비디오를 재생할 것입니다 CLAIRE EVANS : 한 번 더 ADAM ROBERTS : 한 번 더

[비디오 재생] – 불타는 입술에는 언제든지 새로운 작은 도구를 우연히 발견했다 그것은 우리가 만든 것을 바꿔 놓았습니다 – 마젠타 팀의 목표는 창의력에서 기계 학습의 역할을 실제로 탐구하고, 사람들이 표현할 수있는 창조적 인 과정에서 새로운 방식으로 피아노 지니는 우리가 가진 인턴의 위대한 작품입니다 크리스 도나휴 그는 피아노 연주를 할 수있는 알고리즘을 디자인했습니다

커플을 치는 것만으로 피아노 연주를 재현 해 봅니다 컨트롤러의 버튼 그리고 자연스럽게 소리가 나옵니다 전문 피아노 연주자와 훨씬 더 비슷합니다 – 우리가 실제로하는 것들 중 하나 그것에 초점을 다른 기계의 많은 다른 매우 다른 학습 프로젝트는 어떻게 사람들에게 이러한 알고리즘을 조작하십시오

– Flaming과 협력하여 정말 흥분했습니다 입술 음악에 대한 접근 방식이 너무 독창적이기 때문에 우리는 단지 우리가 가지고있는 모든 것을 보여주었습니다 우리는 새로운 경험을 창조하기를 희망합니다 관객은 실시간으로 밴드와 함께 음악을 만들 수 있으며, 피아노 지니를 사용합니다

– 그래서 우리는 지적인 악기와 멜로디를 만들었습니다 Google과 함께 과일을 만들었습니다 [음악 재생] [박수 갈채] 내가 과일을 할 때, 나는 그것을 만지고있다 그리고 나는 매번 그것이 무엇을 할 것인지 정확히 알지 못했습니다 – 각자 그것이 무엇인지 발표하고 있습니다

– 바나나 – 녹색 사과 – 어쩌면 그것은 G의 열쇠에있다 [엄청난 전자 보컬] – 그래서 Google AI와 함께 작업했습니다 그리고 그들은 우리에게 Piano Genie라는 소프트웨어를 보냈습니다

메모를 치면 자동으로 음악이 재생됩니다 [음악 재생] – 우리가 그걸 가지고 놀면할수록, 그게 무엇을 상대로 연주하는지 더 많이 이해할수록 그리고 누구와 함께 노는거야 – 그래서 당신은 다른 리듬이나 다른 음표를 연주합니다 그리고 이것은 계속해서 일어납니다 그래서 실제로 우리가 쓰지 않은 멜로디를 썼습니다

– 기계가 당신을 위해 그것을하는 대신에, 당신은 기계가 뭔가를하도록 격려하고 있습니다 멋지다 1, 2, 3 – 바나나라면 바나나에 꽤 좋다 [웃음] [끝내기] [박수 갈채] JESSE ENGEL : 그래서 알았어 내가 일하는거야? 됐어 네 네

JESSE ENGEL : 네, 거기 있었군요 알았어 JESSE ENGEL : Wayne Coyne입니다 안녕, 코네 : 안녕하세요 [박수 갈채] JESSE ENGEL : 네, 안녕하세요

그래서 우리는이 토론을 시작하고 싶었습니다 기계 학습에 대한 과대 광고 인공 지능 그리고 당신이이 프로젝트 중 하나에 올 때, 많은 선입견이있을 수있다 그것이 상호 작용하는 것과 같을 것이라는 점에 대해 이걸로 어쩌면, 클레어, 너부터 시작하고 싶다

그 선입관이 어떻게 만난지 이야기해라 또는 예상했던 것과 다른 점 오 클레어 : 오 그래, 내 말은, 처음에는 그 말을 부끄러워하지 않는다 우리는 단지 버튼을 누르고 노래를 만들 것이라고 생각했습니다

우리는 그것이 우리가있는 곳이라고 생각했습니다 AI의 기술 발전에 관한 제 말은 아마도 그것이 주류의 과대 광고 일 것입니다 우리를 믿게합니다 이런 식으로 우리 일자리에 올거야 그게 너무 내장적이야

그러나 우리는 정말로 우리가 우리 노래 전부를 정렬 할 수 있다고 생각했습니다 기계에 넣은 다음 새로운 YACHT 노래를 우리에게 줄 것입니다 그리고 우리는 매우 빨리 알아 냈습니다 물론, 그건 우리가있는 곳이 아니야 그것은 정말로 흥미 있었다

왜냐하면 우리는 그 고리 속에있는 인간이되어야한다는 것을 의미했기 때문입니다 그리고 우리는 프로세스에 대한 더 많은 통제권을 가지게되었습니다 우리가 처음에 우리가 믿는 것보다 제 말은 처음에 우리는 기계가 만든 것이 무엇이든간에 그리고 나서 우리는 그것을 연주하고 그것을 수행해야만 할 것입니다 우리 자신의 그러나 실제로, 우리는 모델들과 함께 공동 제작을해야합니다

그리고 우리는 훨씬 더 강한 손을 가져야했습니다 그리고 규칙 세트와 시스템을 생각해 내야했습니다 그리고 우리 고유의 프로세스가 필요합니다 그래서, 비록 당신이 같은 것을 주었더라도 – 우리는 다른 뮤지션이나 정말로이 방에있는 누군가를주었습니다 똑같은 가사가 기계 출력을 생성했습니다

동일한 표기법 데이터를 사용하면 서로 다른 레코드를 만들 수 있습니다 그것은 개인적인 해석에 관한 것이기 때문에 이것으로 무엇을 할 지,이 모든 소스 자료 그래서 나는 정교함의 부족에 유쾌하게 놀랐다 나는 생각한다 네

JESSE ENGEL : 네 웨인, 너의 경험으로 그 느낌을 되니? WAYNE COYNE : 나는 우리 일이 너무 많은 추진력 그리고 나는 항상 – 나는 너무 많은 질문이 있다고 생각한다 있잖아? 너에게 물어볼 질문이있어 그게 무슨 소리 죠? 승인

로스 앤젤레스에는 가벼운 것이 있습니다 맞죠? CLAIRE EVANS : Triforium 네 네 네

그래서 그것이 말하는 단어는 무엇입니까? CLAIRE EVANS : Polyphonoptic 알아 네가 그걸 원한다고 생각 했어 그게 뭐야? 내 말은, 심지어 한 마디인가? 음향학과 같습니다 진짜가 아니에요

내 말은 한 마디 야 WAYNE COYNE : 좋습니다 CLAIRE EVANS : 모든 단어는 하나의 단어입니다 WAYNE COYNE :하지만 그것은 한 마디니까? CLAIRE EVANS : 모든 단어는 하나의 단어입니다 WAYNE COYNE : 나는 뭐였지? [웃음] 사실입니다

그러니까 제 경험으로는 전혀 몰랐습니다 어쨌든 우리가해야할 일이 무엇인지 나는 우리가 무엇을했는지 결정하고 있다고 생각한다 5 분 전에 우리가 한 일을 토대로 할거야 내 말은, 우리가 한 모든 것 아이디어와 에너지 및 추진력으로 가속화되기 시작합니다

그리고 그것이 당신들이 화염 입술을 원했던 이유입니다 있잖아? 왜냐하면, 그들은 뭔가를 할거야, 알지? 그리고 당신은 이러한 자기 부과 된 규칙들에 대해서 이야기했습니다 그리고 우리가 가진 유일한 규칙은 당신입니다 지금해야 해 너는 가야 해

그리고 나는 그것을 좋아합니다 내 말은, 많은 시간을 당신이하고, 시간이 지나면, 당신은 두 번째로 추측합니다 이게 뭐야? 이거 괜찮은거야? 그리고 당신은 돌아가서 그것을 다시합니다 그리고 때로는 그렇게 할 수있는 힘으로, 그것을하십시오 당신은 결정을 내리고 당신은 20 가지 결정을합니다

당신이 그것에 대해 너무 불안한 시간을 갖기 전에 또는 무엇이든 그래서 저는 더 많이 생각합니다 그리고 우리는 우리가 앉아 있기 때문에 아주 운이 좋은거야 거기에 모든 단계가 있습니다 무언가가 효과가 없다면, 우리는 단지 당신을 비난했다

그리고 너도 알다시피, 너는 이걸 고쳐야 해 있잖아? 그리고 저에게 그것은 항상 협박적인 부분입니다 새로운 것 우리에게는 아주 새로운 볼보가 있습니다 차 안에있는 시리우스 방송국을 켜는 법을 아직 안다

있잖아, 너 운전하고있어 당신은 아무도 죽이지 않으려 고합니다 그리고 마지막 비틀즈 역에 가려고합니다 네가 온 줄 알았어 그래서 나는 항상 내가 돌아서는 것을 두려워하게된다

차 꺼져 있거나 뭔가 그래서 그것이 어떻게 작동하는지 모르면, 나는 항상 두려워합니다 그러나 너희들을 거기에서 보내면서 우리가 일하는 방식을 보여 주었다 그리고 나서, 우리는 즉시 가고 싶습니다, 오, 음, 나는 이것을하고 싶다 나는 그것을하고 싶다

그리고 그것은 많은 사람들이 가지고있는 사치가 아니라고 생각합니다 그러나 나는 그것이 우리를 격려했던 것처럼 느꼈다 너희들처럼 어리석은 짓이라면, 너도 알다시피, 고맙게도 우리가있게했습니다 내 말은, 이것이 곧 시작되었다는 생각 이 작은 장치가있는 피아노가 있습니다

그리고 30 초 후, 거기에 과일 한 그릇이 있습니다 스티븐은이 놀라운 클래식 음악을 연주합니다 바나나와 딸기, 오렌지를 사용하는 조각 그리고 당신이 거기에있을 때 그리고 모든 일이 일어날 때, 그것은 상쾌합니다 그리고 저는 저 같은 사람이 그 아이디어를 생각합니다

키보드로 연주하지 않을거야 우리는 기타로 연주하지 않고, 연주하지 않습니다 우리는 과일을 가지고 노는 중이 야 그냥 가져 가라 다른 영역으로

그래서 어떤 사람들은 말합니다 음, 그건 아마도 아이들이 무엇을 할 것인가

있잖아, 네, 음표를 연주 할 수 있을까요? 오렌지 또는 딸기에 그리고 나처럼 될거야 네 ADAM ROBERTS : 그래, 우리가 거기에 있었지만, 맞아, 그래서 우리는 당신이 마주 쳤던 일종의 문제를 해결할 수있었습니다 예측할 수없는 수준이있다

이러한 알고리즘에 권리? 네 네 ADAM ROBERTS : 그리고 저는 여러분들 모두가 당신의 일에서 그것을 경험했습니다 그래서 나는 듣기에 호기심이 많다

클레어와 함께해라 사물의 일부가 있었기 때문에 네가 어떤 선택 의지를 포기하고 있다는 것을 맞아, 너 한테 가사를 쓰게 한거야 그리고 당신의 경우, 당신은 라이브 공연을 할 것입니다 어디에서 재생할지 정확히 알 수 없습니다

네 네 ADAM ROBERTS : 어떻게 포기하고 있니? 이 기관의 조금, 어떻게 통제력을 유지하고 예술적 비전이 여전히 유지되는지 확인하십시오 이 위에 빛나는? 그래, 그래 나는 궁극적으로 아무것도 생각하지 않는다

우리 이름으로 세상에 나간다 몇 달 동안 술에 취하지 않은 우리 거실에있는 컴퓨터에 우리에게는 궁극적 인 대행사가 있습니다 그리고 우리가 시작하는 프로젝트도하고 있다는 사실은 일종의 심미적 도발과 같습니다 우리는 우리가하고 싶다고 결정했습니다

하지만 동시에– 나도 모르겠다 내 말은, 대체 할게 여기 있다고 생각해 우리 프로세스의 측면에서 초기 잼, 초기 소리 수집, 초기 채우기 가사 아이디어와 함께 노트북을, 일종의 생성 순간 그리고 서로 방에 끼어 들지 않고, 우리는 모델로 서버에 끼어 있습니다 그리고 우리가 끝내는 것은 대량의 소스 자료입니다

함께 일해 그리고 내 마음 속에서 일이 시작됩니다 창조적 인 작업이 시작됩니다 그리고 나는 작가이기도합니다 그래서 나는 강하게 믿습니다

그 글쓰기는 편집 중입니다 맨 처음에 페이지에 넣은 것 푸가 상태에서 일어나는 일과 같습니다 총 난장판 그리고 나서 실제로 뭔가를 할 때까지는 쓸모가 없습니다 그리고 나는 그것이 같은 것이라고 생각합니다

내 말은, 가사 아이디어로 가득 찬 노트북은 노래가 아냐 정말 멋진 소리로 스튜디오에서 한 잼 순간에는 노래가 아닙니다 당신이 그 일들로 무엇을하는지, 당신을 어떻게 데려 오는지, 구조화 방법, 배열 방법, 생성 방법 그들을 수행하고, 수행하며, 그리고 아마도 앞으로 수년 동안 그것들을 수행하십시오, 그 노래 야 네 네

CLAIRE EVANS : 그래서 나는 정말로 우리가 무엇이라도 포기했던 것처럼 많이 느껴 져요 우리는 일종의 속도를 높이거나 변경했습니다 프로세스의 성격 나는 그것이 더 빠르다고 생각조차하지 않는다 사실, 느린 것 같아요

수동으로 주석을 달려면 시간이 오래 걸렸다 고 생각합니다 MIDI에서 우리의 뒤 카탈로그와 올라와 200 만 단어의 사물로 우리가 생각한 것과 똑같은 일이 어떤면에서 우리 머리 속에 차고있다 나는 그것이 실제로 여러면에서 지루하다고 생각합니다 그래, 네가 포기할 것을 결정할거야

그러나 당신은 또한 매개 변수를 결정합니다 네가 어떻게하는지 그리고 나서 당신이 나중에 그걸로 무엇을하는지 정말 중요한 것입니다 JESSE ENGEL : 그것은 작곡 과정에서 더 많은 것이 었습니다 얼마나 많은 것을 통제하고 있는지 그리고 얼마나 편집하고 있는지

그래서 웨인 (Wayne)은 더 많은 성과를 거둔이 작품을 가지고, 맞아, 너는이 [무관심한] 상호 작용이있다 어디 있니? 너 얼마나 있니? 무슨 일이 일어나고 있는지 그리고 얼마나 많은 기회가 있는지를 제어합니다 실적의 요소? WAYNE COYNE : 네 내 말은, 우리가 그걸 보았던 방식, 심지어 그 길까지 우리는 심지어 보았다 너희들은

우린 우리가 공동 작업자를 데려 오는 중 내가 무슨 뜻인지 알지? 우리는 항상 그렇게 해 그리고 때때로 당신은 그것을 후회하게됩니다, 아시죠? [웃음] 한 번 노래에 디지털 트럼펫 부분이있었습니다

우리는 그것이 훌륭하다고 생각했습니다 그리고 트럼펫 연주자가 스튜디오에 왔습니다 그리고 우리는 네가 무엇이든 원하는대로 놀아달라고 말했습니다 있잖아? 그리고 조금씩, 우리는 무엇을 좋아하지 않았습니다 그는 어떤 이유로 든 연주했습니다

그의 잘못이 아니었다 우리는 특정 아이디어에 갇혔다 그리고 그 말에 우리는 말했습니다, 음, 우리가 한 것을 정확하게 연주 할 수 있습니까? 진짜 트럼펫에서만 연주하니? 그리고 그가 떠난 후, 우리는 실제로 나팔을 사용하지 않았습니다 있잖아? 하지만이 모든 일은 내가이 일을 좋아한다고 말하는 과정입니까? 내가 얼마나 신경 쓰겠 니? 나에게 얼마나 중요합니까? 그리고 당신은이 모든 다른 이유들을 겪습니다 그리고 진짜 이유가 없습니다

그것의 끝에 당신의 이유는 나는 그것을 좋아한다 나는 그것에 깊은 의미가 없다 우리를 위해서, 우리는 그것에 들어갔다는 것을 의미합니다 우리가이 협력을하기를 원한다는 것을 알고 있습니다 그리고 트럼펫 연주자와는 달리 우리가 만질 수있는 너 한테이 말을했다

우리는 정말로 나는 소리로 시작했다 처음부터 좋아했다 그리고 나는 소리를 듣기 시작할 것입니다 나는 이미 노래를 생각하기 시작했습니다 나는, 어이, 다시 해봐

있잖아, 너는 일을 떠난다 나는 기다린다 이 다른 소리로 돌아가십시오 그래서, 저에게, 그것은 제가하는 모든 것입니다 그것은 말하고있는 것을 촉발시키고 있습니다

오, 나는 그것을 노래로 바꿀 수있다 나는 이미 내가 무엇을 노래하고 싶은지 알고있다 우리가 그것을 우리가 생각하는 것으로 바꾸어 놓을 것을 알고 있습니다 수행해야한다 우리는 생각할 때 결코 그것을 고려하지 않습니다

그것이 될 것 인 것의 안에서 그래, 나에게는 단지 두 개의 다른 세계 일 뿐이다 있잖아? JESSE ENGEL : 네 WAYNE COYNE : 그리고 우리가 알고 있다는 것을 알고 있습니다 우리가 관객들이 그 부분의 일부가되기를 바란다면, 나는 우리가 갔을 때, 아이디어에 대한 우리의 초기 파동이 빠르게 우리가 생각한 그걸 만들려고 – 우리가 청중과 함께있을 때 그들은 우리와 함께이 일을하고 있습니다

그들은 물건에 대한 그들의 공헌을 이해할 것이다 우리는 상호 작용하는 것에 대해서 이야기했다 당신은 당신이 그것을하기 위해 무엇을하고 있는지 확실히 모릅니다 너도 알다시피, 너는 네가 느끼는 종류의 것들을 많이 가지고있다 너는 팔을 움직이기로되어있어

또는 특정 장소에 서서 뭔가를합니다 그러나 당신은 그것이 무엇을하고 있는지 확실히 말할 수 없습니다 그리고 나는 우리가 엄청난 노력을 기울인 것으로 생각한다 이 일이 벌어지고있을 때, 좋고, 나쁘고, 무관심하다 그것의 성장, 그것의 죽음, 그것의 지루함, 그것의 흥분에

당신이 그것에 기여했습니다 나에게 어떤 것은 이미 우리가 원하는 것입니다 왜냐하면 저에게 재미가있는 곳이기 때문입니다 그것이 에너지의 원천입니다 우리는 실제로 우리가 가장 큰 것을 만들 것이라고 말하고있는 것이 아닙니다

음악의 조각 우리가 할 수도 있습니다 하지만 나에게 그것은 콘서트 나 다른 무엇이 아닙니다 우리 모두는이 일에 참여할 것입니다 우리는 우리 자신의 에너지를 창조하려고합니다

우리 자신의 시간을 만들고, 우리 자신의 일을 만듭니다 JESSE ENGEL : 그리고 언급 했으니 까 상호 작용에는 예측할 수없는 것이있다 이걸로 그리고 많은 음악과 기술 그 예측 불가능 성으로 항상 진화 해왔다

기타 앰프는 왜곡되지 않았습니다 그러나 사람들은 그들을 위로 돌 렸고 그들은 위대한 소리가 나는 것을 알았습니다 있잖아? 또는 원래 808 드럼이 생각났습니다 드럼 세트를 정확하게 재현하는 것입니다 하지만, 전자, 힙합에서 정말 좋은 것처럼 들리네

음악 WAYNE COYNE : 물론 그렇습니다 JESSE ENGEL :이 새로운 기술로 인해, 기계 학습, 클레어처럼 당신은 그들이 어디에서 실패했는지에 대한 경험이 있습니다 아마도 실패는 흥미로운 부분이었을 것입니다 그래, 그래

내 말은, 그게 실패에 관한 전부라고 생각해 완벽한 순간은 내가 관심을 멈추고, 나는 생각한다 나는 멜로디 정보가 빗나간 그 순간들을 생각한다 인간이 수행하거나 수행하는 모든 것에서, 또는 도구가없는 순간 그것이해야 할 일에 대한 당신의 기대에 응하십시오 하지만 완전히 다른 무언가를합니다

그것은 808이나 NSynth와 같이 더 흥미 롭습니다 그건 그렇고, 그것은 놀라운 신경 합성기입니다 Google은 만든다 하지만, 네, 그 순간이 있습니다 나는 이것이 가장 흥미로운 결과라고 생각한다 당신이 무엇을 결정할 수 있기 때문에 당신의 취향은 때때로 있습니다

나는 취향이 종종 뭔가에 대한 반응이라고 생각한다 당신에게서 직접 오는 것보다 너는 뭔가를 본다 너는 마치 내가 좋아한다 나는 그것을 좋아하지 않는다 그리고 그것이 당신이 당신이 누구인지를 결정하는 것과 같습니다

당신이하고 싶은 것, 어떻게 자신을 표현하고 싶은지 그리고 나는 그것이 매우 흥미롭고 도움이된다고 생각합니다 이런 종류의 중립적 인 내 말은, 인공 지능은 중립적이라는 말을 안다 로드 된 물건의 -하지만 중립적 인 다른 파티 너의 밴드 메이트 중 하나가 아닌 방에 그 아이디어를 제안합니다 그리고 우리는 모두 그것에 동의 할 수 있습니다

그리고 우리 모두는 그것에 동의 할 수 있습니다 우리가 그 생각을 없애면 누구도 상처를 입지 않습니다 왜냐하면 그것은 우리 중 누구 에게서도 오지 않았기 때문입니다 우리는 그것과 사랑에 빠지며 앞으로 나아갈 수 있습니다 그룹으로 또는 아닙니다

그리고 우리는 우리 관계가 누구인지를 결정할 수 있습니다 동의하거나 반대함으로써 서로에게 생성 된 다른 출력에서 하지만, NSynth는 예를 들어, 여러면에서 808과 비슷합니다 이 도구가 한 가지 일을하기 때문에, 그것은 제비의 차이를 나누기로되어 있습니다 빛과 공간을 사용하여 다른 소리의 제 의견으로는 일종의 실패입니다

내 말은, 그것은 그 차이를 설득력있게 찾지 못한다 자동차 경적과 플루트 사이 샘플 속도의 종류가 너무 낮아 그것이 들리는 종류의 리듬 우키하고 괴상 해 그리고 처음에는 우리는 그게 마치 우리는 이것이 실패라고 생각했습니다 우리는 그것이 재미 있지 않다고 생각했습니다 우리가 808과 같은 생각을 시작할 때까지는 아니 었습니다 우리는 그것이 그 자체의 미적 감각을 가진 도구임을 깨닫게되었고, 그 자신의 종류의 이상하고, 멍청한, 갈대 소리 그것은 우리에게 정말로 흥미로워졌다

그리고 지금은 우리 기록의 큰 부분입니다 다시 말하면,이 객체들 중 하나이기 때문에 그것은 하이테크와 로우 테크 모두 동시에입니다 그리고 그것은 정말로 낮은 Fi라고 들립니다 하지만 수백만 달러의 기계 학습이 필요합니다 그 소리를내는 연구

그 병치는 우리에게 꽤 매력적입니다 아담 로버트 : 예, 불행하게도, 우리는 시간 중 하지만 클레어에게 감사드립니다 WAYNE COYNE : 예! ADAM ROBERTS : 그리고 Wayne for coming [박수 갈채] 네

ADAM ROBERTS : 고마워요 알았어, 고마워 그리고 그들은 오늘 밤 둘 다 놀고 있습니다 그래서 쇼를 확인하십시오 [GOOGLE LOGO MUSIC]

Cloud TPU Pods: AI Supercomputing for Large Machine Learning Problems (Google I/O'19)

[음악 재생] 마틴 고너 : 안녕하세요 모두와 주셔서 감사합니다

아침 8시 30 분에이 세션에 오신 것을 환영합니다 TPUs 및 TPU 포드에 대해 따라서 맞춤 제작 된 가속기입니다 Google이 기계 학습을 가속화하도록 설계 한 워크로드 그리고 내가 그들에 관해 모든 것을 말해주기 전에, 나와 카즈, 나는 뭔가하고 싶다 물론 이것은 라이브이기 때문에 라이브 데모를보고 싶습니다

그리고 무대 위에 서서 여기서 훈련하고 싶습니다 그 큰 모델 중 하나 인 TPU 포드 옛날에 기차를 타고 가곤 했었어 그리고 우리가 훈련을 끝낼 수 있는지 알게 될 것입니다 이 세션에서 그래서 훈련을 시작하겠습니다 나는 여기서 내가하고있는 것을 정확히 설명 할 것이다

나는 지금 막 시작하고있다 모든 셀을 실행하십시오 달리고있는 것 같습니다 좋아, 그냥 확인 중이 야 128 코어 TPU 포드에서 실행하고 있습니다

그래서 로그에서 볼 수있는 것들 중 하나가 여기에 있습니다 모든 TPUs가 나타나기 때문입니다 0, 1, 2, 6 및 128까지 줄입니다 좋아, 그럼 이거 달리기 야 나는 그것에 만족한다

TPUs에 대해 더 많이 들어 봅시다 우선 실리콘 조각은 무엇입니까? 그리고 이것은 내가 시작한 데모입니다 그것은 객체 감지 데모입니다 300,000 이미지의 야생 동물 데이터 세트에 대한 교육입니다 왜 야생 동물인가? 너에게 귀여운 팬더를 보여줄 수 있기 때문에

그리고 귀여운 전자 제품을 보여줄 수 있습니다 그래서 이것은 TPU v2입니다 그리고 두 번째 버전 인 TPU v3가 있습니다 그것들은 꽤 큰 보드입니다 이것은 거대합니다

보시다시피, 칩 위에 4 개의 칩이 있습니다 각 칩은 듀얼 코어이므로 이러한 보드 각각 그것들에 8 개의 TPU 코어가 있습니다 각 코어에는 두 개의 유닛이 있습니다 그것은 벡터 처리 단위입니다 이것은 상당히 표준적인 데이터 지향적 인 프로세서이며, 범용 프로세서

기계 학습을 위해 특별하게 만드는 이유 행렬 곱셈 단위입니다 TPU에는 하드웨어 기반 매트릭스가 내장되어 있습니다 한 번에 128 x 128 행렬에 곱할 수있는 승수 그렇다면이 아키텍처에 대한 특별한 점은 무엇입니까? 우리가 사용한 두 가지 트릭이 있습니다 신속하고 효율적으로 만들 수 있습니다

첫 번째는 준 표준이라고 할 수 있습니다 정밀도가 떨어졌습니다 신경망을 훈련 할 때 정밀도가 떨어집니다 32 비트 부동 소수점에서 16 비트로 사람들이 아주 자주하는 일입니다 신경 네트워크가 손실에 상당히 저항하기 때문에 정밀도

실제로, 심지어 때로는 발생합니다 감소 된 정밀도로 인해 발생하는 잡음 일종의 정규화 자 역할을하며 융합을 돕습니다 때로는 정확도를 떨어 뜨릴 때 운이 좋은 경우도 있습니다 그러나이 차트에서 볼 수 있듯이 float16과 float32, 부동 소수점 형식, 그들은 같은 번호가 없습니다 지수 비트의 동일한 범위를 커버하지 마십시오 따라서 모델을 가져와 모든 float32를 다운 그레이드 할 때 float16s에, 당신은 언더 플로우 또는 오버플로에 들어갈 수도 있습니다 문제

그리고 그것이 당신의 모델이라면, 그것은 보통 없습니다 들어가서 고치기가 너무 힘듭니다 하지만 GitHub의 코드를 사용하고 있다면 너는 물건을 고칠 곳을 모른다 이것은 매우 문제가 될 수 있습니다 그래서 TPUs에서 우리는 다른 것을 선택했습니다

실제로 우리는 다른 부동 소수점을 설계했습니다 형식은 bfloat16입니다 보시다시피, 실제로는 분수 비트 만있는 float32와 정확히 동일합니다 끊다 그래서 요점은 정확히 같은 숫자입니다

지수 비트의 정확히 같은 범위 따라서 일반적으로 드롭 인 대체품입니다 float32 및 정밀도 감소 그래서 보통 당신을 위해, 아무것도 없습니다 당신의 모델에서 감소 속도의 혜택을 누리기 위해해야 ​​할 일 정도

TPU는 자동으로, 선박에서, 하드웨어에서 두 번째 요령은 건축입니다 이 행렬 곱셈 단위의 설계입니다 어떻게 작동하는지 이해하면 머리 속에서 행렬을 수행하는 방법을 그림으로 그려보십시오 곱셈

결과 하나, 결과 하나 매트릭스, 학교에서 미적분을 기억하려고, 점 제품입니다 한 행의 한 행과 한 행의 내적 제 2 매트릭스의 이제 내적 제품이란 무엇입니까? 내적은 일련의 곱셈 – 누산 연산이며, 이 말은 당신 만이 행렬 곱셈을 수행 할 필요가있다 곱셈되고 누적된다 그리고 16 비트로 곱셈 – 누산하고, 왜냐하면 우리는 bfloat16을 사용하여 정밀도를 줄 였기 때문입니다 그것은 작고 작은 실리콘 조각입니다

16 비트 곱셈 누적 기는 아주 작은 실리콘 조각입니다 그리고 당신이 여기에있는 것처럼 어레이로 함께 묶는다면 따라서 실생활에서 이것은 128 x 128 배열 일 것입니다 그것은 수축기 배열이라고 불립니다 수축기는 그리스어로 흐름을 의미합니다

데이터를 통해 데이터를 전달하기 때문입니다 그래서 작동하는 방식은 하나의 행렬을 배열에로드하는 것입니다 그런 다음 배열을 통해 두 번째 행렬을 흐르게합니다 그리고 날 믿어야 해, 아니면 애니메이션 작업에 약간의 시간을 할애하고, 회색 점이 끝날 때까지 그 곱셈 – 누산기를 통해 흐르는, 오른쪽의 모든 점 제품은 결과 행렬을 만듭니다 그래서 이것은 원 샷 조작입니다

어디에도 저장할 수있는 중간 값이 없으며 메모리, 레지스터에 모든 중간 값이 와이어에 흐른다 하나의 계산 단위에서 두 번째 계산 단위로 매우 효율적입니다 그리고 무엇보다, 그것은 단지 만들어졌습니다

그 작은 16 비트 곱셈 누적 기, 이는 우리가 많은 것을 하나의 칩에 넣을 수 있음을 의미합니다 128 x 128은 16,000 개의 다중 누산기입니다 그리고 그것이 하나의 TPU 코어에 얼마나 많이 들어가는 지, 두 배입니다 2 개의 TPU 코어 이것이 이것이 밀도를 높여주는 이유입니다

밀도는 전력 효율성을 의미합니다 또한 데이터 센터의 전력 효율성은 비용을 의미합니다 그리고 물론, 당신은 얼마나 싸구려인지 알고 싶습니다 또는 이러한 것들이 얼마나 빠릅니다 작년부터 기억할 수도있는 사람들이 있습니다

나는 내가 만든 것을 말하며,이 평면 모델, 그래서 저는 이것을 오늘 벤치 마크로 사용하고 있습니다 Google Cloud의 AI 플랫폼에서 다른 구성을 얻는 것은 매우 쉽습니다 그래서 나는이 기차가 얼마나 빨리 테스트 할 수 있습니다 저의 기준은 빠른 GPU에서이 모델입니다 4 시간 반 만에 열차를 탄다

하지만 강력한 GPU를 갖춘 5 대의 컴퓨터를 사용할 수도 있습니다 클러스터에서 그리고 5 대의 머신에서 5 개의 GPU, 이 모델은 한 시간 안에 훈련 할 것입니다 그리고 1 시간이 정확히 있기 때문에이 번호를 선택했습니다 이 모델이 하나의 TPU v2에서 훈련하는 데 걸리는 시간

엄지 손가락의 규칙 때문에 기억하고 싶습니다 4 개의 칩을 가진 대략 1 TPU v2이고, 대략 5 개의 강력한 GPU와 비슷합니다 그것은 속도 측면에서입니다 그러나 보시다시피, 거의 3 배 저렴합니다 이것이 아키텍처 최적화의 요점입니다

특히 신경망 작업 부하에 적합합니다 이 기능이 소프트웨어에서 어떻게 작동하는지 알고 싶을 수도 있습니다 따라서 TensorFlow에서 TensorFlow 또는 Keras를 사용하는 경우, 귀하의 파이썬 코드 TensorFlow 파이썬 코드 전산 그래프를 생성합니다 그것이 TensorFlow가 작동하는 방법입니다 따라서 전체 신경망은 그래프로 표현됩니다

이제,이 그래프가 TPU로 전송됩니다 TPU는 파이썬 코드를 실행하지 않습니다 이 그래프는 XLA, Accelerated Linear 대수학 컴파일러, 그게 어떻게 TPU에서 실행될 TPU 마이크로 코드가됩니다 그리고이 아키텍처의 한 가지 좋은 부작용 TensorFlow 코드에서, 표준 tfdata

DataSet을 통해 데이터를로드합니다 API, 필요한 경우, TPU와 함께 필요한 경우 심지어 데이터로드 부분 또는 이미지 크기 조정 또는 기타 데이터 파이프 라인에 있고, 그래프에서 끝나고, TPU에서 실행된다 TPU가 Google Cloud Storage에서 데이터를 가져옵니다 훈련 중 직접 그래서 매우 효율적입니다

실제로 이것을 코드로 어떻게 작성합니까? Keras에서 보여 드리죠 그리고주의해야 할 것은 TensorFlow 114의 Keras입니다 이 다음 날에 있어야합니다 API는 TensorFlow 1

13에서 약간 다릅니다 오늘은 오히려 너에게 그걸 보여줄거야 새로운 것, 내일 또는 다음 주 현재로 그래서 그것은 몇 줄의 코드 일뿐입니다 첫 번째 줄 TPUClusterResolver가 있습니다

대부분의 플랫폼에서는 매개 변수없이 호출 할 수 있습니다 연결된 TPU를 찾습니다 TPU는 원격으로 연결된 가속기입니다 이것은 그것을 찾습니다 TPU를 초기화 한 다음 새 배포판을 사용합니다

이 TPU를 기반으로 TPU 전략을 정의하는 TensorFlow의 API 그리고 전략으로 말하면됩니다 스코프, 뒤에 오는 모든 것은 완벽하게 정상적인 Keras 코드입니다 그런 다음 모델을 정의하고 컴파일하고, 당신은 modelfit, modelevaluate, model

predict, 네가 Keras에서하는 일은 뭐니? 그래서 Keras에서 이것은 문자 그대로이 네 줄의 코드입니다 추가하려면 – TPU에서 일하기 그리고이 4 줄의 코드 또한 모델을 분산 모델로 변환합니다 하나의 GPU조차도 TPU를 기억하십시오 8 개의 코어가있는 보드입니다

그래서 가서 분산 컴퓨팅입니다 그리고이 네 줄의 코드가 제자리에 놓였습니다 당신을위한 분산 컴퓨팅의 모든 기계류 통지 할 하나의 매개 변수 TPU 전략에서 볼 수 있습니다

steps_per_run은 100입니다 그래서 이것이 최적화입니다 이것은 TPU에게 알려주고 100 회분의 교육을 실행하십시오 끝날 때까지 다시보고하지 마세요 네트워크 연결 가속기이기 때문에, TPU가 다시보고하기를 원하지 않는다

성능상의 이유로 각 배치 후에 이것이 바로 소프트웨어입니다 자신의 코드를 작성하고 싶지 않으면, 나는 그렇게하도록 권합니다 하지만 그렇지 않으면 우리는 도서관 전체를 가지고 있습니다 TPU 최적화 모델의 그래서 TensorFlow / tpu GitHub에서 찾을 수 있습니다

저장소 이미지에 모든 것이 있습니다 비전 공간에서, 기계 번역에서, 언어 및 NLP 공간을 음성 인식에 사용합니다 GaN 모델로도 게임을 즐길 수 있습니다 우리가 무대에서 시연하고있는 것, 지금 RetinaNet이 모델을 훈련하고 있다는 것을 기억하십시오

그래서 이것은 하나의 물체 탐지 모델입니다 그리고 저는이 모델을 좋아해요 어떻게 작동하는지 물체 감지에서 이미지를 넣고 얻을 수있는 것 그냥 라벨이 아니야 여긴 개야,이 팬더 야

하지만 실제로 그 객체가있는 곳에 상자가 생깁니다 물체 감지 모델에는 두 가지 종류가 있습니다 원샷 감지기가 있습니다 일반적으로 빠르지 만 종류가 정확하지 않습니다 그 다음 훨씬 더 많은 2 단 검출기 정확하지만 훨씬 느립니다

그리고 나는 RetinaNet을 좋아합니다 왜냐하면 그들은 실제로 이것을 가장 빠른 방법으로 찾았다 그리고 당신이 할 수있는 가장 정확한 모델 오늘날의 물체 감지에서 찾아보십시오 그리고 그것은 매우 간단한 속임수입니다 나는 그 뒤에있는 모든 수학을 설명하지 않을거야

기본적으로 이러한 탐지 모델에서, 당신은 후보 탐지로 시작합니다 그리고 탐지를 찾아 내기 위해 잘라냅니다 상자 안에 실제 물건이 들어있는 상자 그리고 그 점은 당신이 보는 파란 상자들, 그들에게는 아무것도 없다 그래서 훈련 중에도 그들은 매우 쉽게 보이지 않는 것으로 분류되고 상자를 따라 이동하며, 아주 작은 오류

그러나 당신은 그들 중 많은 것을 가지고있다 이 모델의 손실을 계산할 때, 손실에서 아주 작은 오류가 아주 많습니다 그리고 그 엄청난 양의 아주 작은 오류들이 결국에는 매우 커야하며 유용한 신호를 압도합니다 그래서 2 단 검출기는 그 후보 상자에 대해 훨씬 더주의를 기울임으로써 1 단 검출기에서, 당신은 시작합니다 다수의 후보 상자가 있습니다

RetinaNet에서 발견 한 트릭 손실에 조금 수학 트릭입니다 모든 사람의 기여가 그 쉬운 상자는 작게 유지됩니다 결과는 빠르고 정확합니다 그래서 내가 다시 여기로 가게 해줘 나는 실제로 내가 한 일에 대해 정확히 말하고 싶다 정확히 말하면, 이 데모를 시작했을 때

저는 여러분 대부분이 Google Cloud Platform에 익숙하다고 생각합니다 그래서 여기에 Google Cloud Platform 콘솔이 열립니다 Google Cloud Platform에서는 나는 AI 플랫폼이라는 도구를 가지고 있는데, 그것을 아는 사람들에게는 훈련을위한 시설이 있습니다 작업을 수행하고 REST API 뒤에 모델을 배치하는 방법 봉사를 위해 하지만 노트북이라는 새로운 기능이 있습니다

AI 플랫폼에서 모든 설치 준비가 완료되었습니다 작업을위한 노트북 – 그래, 그럼 이걸로 바꾸자 TensorFlow, PyTorch에서는 GPU를 사용합니다 문자 그대로 클릭 한 번으로 작동합니다 새로운 인스턴스, TensorFlow 인스턴스가 필요합니다

Jupyter 노트북이 설치된 상태에서 얻은 정보 실행중인 인스턴스이지만 링크가있는 인스턴스입니다 Jupyter를여십시오 예를 들어, 이건 그리고 그것은 Jupyter를 열 것입니다, 하지만 이미 열려있어 그래서 다른 것을 선택하라고 요구하고 있지만, 여기 있습니다 그리고 여기서, 당신은 실제로 정상적으로 일할 수 있습니다 Jupyter 환경에서 강력한 가속기를 사용하십시오 내가 TPU를 가지고 있지 않다는 것을 눈치 챘을 것입니다

옵션, 실제로 여기에,하지만 여기, 가속기 추가 용 그게 다가올거야 하지만 여기에서는 Jupyter 노트북 인스턴스를 사용하고 있습니다 TPU v3 128 코어 포드에 의해 전원이 공급됩니다 나는 그것을 어떻게 했는가? 명령 행에서 실제로 가능합니다

여기에 명령 줄을 알려 줘 거기에 대해서는 아무 것도 없습니다 하나의 gcloud 계산 명령 행이 있습니다 인스턴스로 시작하고 두 번째 gcloud 계산 명령 라인을 눌러 TPU를 시작하십시오 가상 시스템처럼 TPU를 프로비저닝합니다

Google의 클라우드 이것이 내가 한 일입니다 바로 지금 실행중인 것입니다 그래서 우리가 무엇인지 보자 여기 아직 실행 중입니다 보시다시피 다음 100 배치를 대기열에 넣으십시오

그리고 그것은 훈련입니다 대략 6,000 명 중 4,000 명이 단계입니다 세션의 끝에서이 데모를 다시 확인하겠습니다 이 데모는 내가 그것을 할 때, 무대에서 그것을 실행하기 위해, 나는 또한 우리가 얼마나 빨리 TPU v3 대 v2s 이론적으로 v3는 v2보다 약 2 배 강력합니다

하지만 당신이 충분히 먹이면 효과가 있습니다 모든 하드웨어를 사용하도록 노력하십시오 레티 나 넷 (RetinaNet)에서는 훈련이 가능합니다 다양한 크기의 이미지에 물론, 작은 이미지를 훈련하면 256 픽셀 이미지, 그것은 훨씬 더 빠를 것이다

초당 이미지의 관점에서 그리고 나는 둘 다 시도했다 TPU v2s 및 v3s 당신은 작은 이미지를 볼 수 있습니다, 당신은 약간의 충돌을 얻을 성능은 TPU v3에서 나오지만, 거의 2 배가되지는 않습니다 그러나 당신이 더 크고 더 큰 심상에 도착할 때, 당신은 더 많은 일로 하드웨어를 먹이고 있습니다

640 픽셀 이미지에서 TPU v3의 속도를 높입니다 이론적 인 x2 인자에 가까워지고있다 이런 이유로이 데모를 여기서 실행하고 있습니다 TPU v3 포드의 512 픽셀 이미지 크기 나는 포드에 대해서 이야기하고있다

하지만 정확히이 포드는 무엇입니까? TPU 포드에 대해 자세히 알려면 Kaz에게 lectern를주고 싶다 Kaz 감사합니다 KAZ SATO : 고마워, 마틴 [박수 갈채] 따라서 필자는 클라우드 TPU 포드를 직접 소개합니다 꼬투리는 무엇입니까? 클라우드 TPU의 대규모 클러스터입니다

이제 버전 2 포드는 공개 베타 버전으로 제공됩니다 512 TPU 코어가있는 116 페타 플롭을 제공합니다 차세대 버전 3 포드 공개 베타 버전이기도합니다 2,048 TPU 코어가있는 100 페타 플롭스 이상 그 성능 수치는 가장 높은 수치입니다

슈퍼 컴퓨터 따라서 클라우드 TPU 포드는 AI 슈퍼 컴퓨터입니다 Google이 처음부터 만들었습니다 그러나 여러분 중 일부는 생각할 수도 있습니다 한 무리의 TPU 인스턴스와 클라우드 간의 차이점 TPU 포드? 차이점은 상호 연결입니다

Google은 초고속 상호 연결을 개발했습니다 슈퍼 컴퓨터 기술에서 파생 된 하드웨어, 매우 짧은 대기 시간으로 수천 개의 TPU를 연결합니다 그것은 당신을 위해 무엇을합니까? 애니메이션에서 볼 수 있듯이 업데이트 할 때마다 단일 TPU상의 단일 파라미터, 다른 모든 수천과 동기화됩니다 하드웨어에 의해 즉각적으로 TPUs의 즉, TensorFlow 사용자는 전체 포드를 사용할 수 있습니다

수천 대가있는 거대한 단일 기계 그 안에 TPU 코어의 단일 컴퓨터를 사용하는 것만 큼 쉽습니다 AI 슈퍼 컴퓨터이기 때문에 궁금해 할 것입니다 당신은 또한 최고 높은 비용을 취할 수 있습니다 그러나 그렇지 않습니다 TPU 창을 사용하여 시작할 수 있습니다

32 코어를 초기 비용없이 시간당 24 달러로 제공합니다 따라서 수백만 달러를 지불 할 필요가 없습니다 자신의 수퍼 컴퓨터를 처음부터 만들 수 있습니다 클라우드에서 몇 시간 동안 임대 할 수 있습니다 버전 3 포드는 32 코어로 프로비저닝 될 수 있습니다

시간당 32 달러에 불과합니다 크기가 더 큰 경우 서비스 담당자에게 문의하십시오 가격 책정 GPU를 통한 TPU 포드의 비용 이점은 무엇입니까? 여기에 비교 결과가 있습니다 가득 차있는 버전 2 포드로, 512 TPU 코어를 사용하면 동일한 ResNet-50 모델을 교육 할 수 있습니다 38 배 저렴한 비용으로 27 배 빠른 속도

이것은 TPU 포드의 명확한 이점을 보여줍니다 일반적인 GPU 기반 솔루션 TPU 포드에서 얻을 수있는 다른 이점도 있습니다 이베이의 경우를 살펴 보겠습니다 eBay에는 10 억 가지 이상의 제품 목록이 있습니다 특정 제품을 더 쉽게 검색 할 수 있도록 10 억 개 제품에서 새로운 시각적 검색 기능을 구축했습니다 특색

그리고 모델을 훈련시키기 위해, 그들은 5500 만 개의 이미지를 사용했습니다 그래서 그들에게는 정말 대규모 훈련입니다 그리고 그들은 Cloud TPU 포드와 eBay를 사용했습니다 100 배 빠른 교육 시간을 얻을 수 있었고, 기존 GPU 서비스에 비해 또한 10 %의 정확도 향상 효과도 얻을 수 있습니다 그게 왜? TPU 자체가 정확성을 높이기 위해 설계되지 않았습니다

그 정도 그러나 당신이 훈련 속도를 증가시킬 수 없기 때문에 10 배 또는 100 배, 즉 데이터를 의미합니다 과학자 또는 연구원은 100 배 더 많은 10 배를 가질 수 있습니다 시도 같은 반복을위한 반복 하이퍼 파라미터의 다른 조합 또는 다른 전처리 등등 따라서 eBay의 경우 정확도가 10 % 이상 향상되었습니다

어떤 종류의 TensorFlow 코드를 보자 당신은 TPU 포드로부터 그 이익을 얻기 위해 글을 쓸 것입니다 그리고 실제 코드를 살펴보기 전에, 나는 되돌아 보려고 노력한다 과거에 필요한 노력은 무엇 이었습니까? 대규모 분산 교육을 구현하려면? 단일 컴퓨터에 많은 GPU 또는 TPU 사용 즉, 소위 분산 형 교육이라고합니다 그리고 두 가지 방법이 있습니다

하나는 데이터 병렬이고 다른 하나는 모델 병렬입니다 우선 데이터 병렬에 대해 이야기 해 봅시다 다이어그램에서 볼 수 있듯이 데이터가 병렬 인 경우, 교육 데이터를 여러 GPU로 분할해야합니다 또는 TPU 노드 또한 모델과 동일한 매개 변수 세트를 공유해야합니다

그렇게하기 위해서는 GPU 또는 TPU 클러스터를 설정해야합니다 혼자서 또한 매개 변수 서버를 설정해야합니다 매개 변수의 모든 업데이트를 공유합니다 모든 GPU 또는 TPU 중에서 따라서 복잡한 설정입니다

그리고 많은 경우에, 당신은 – 동기화 오버 헤드가 발생할 것입니다 수백이나 수천 명의 사람들이 있다면 단일 클러스터에있는 TPU 또는 GPU 중 그 일은 엄청난 오버 헤드가 될 것입니다 그리고 그것은 확장 성을 제한합니다 하지만 TPU 포드로 하드웨어가 처리합니다 고속 인터커넥트가 동기화됩니다

단일 TPU의 모든 매개 변수 업데이트 다른 수천 개의 TPU가 순식간에 매우 짧은 대기 시간 따라서 매개 변수 서버를 설정할 필요가 없습니다 또는 대형 GPU 클러스터를 설정할 필요가 없습니다 혼자서 또한 거의 선형적인 확장 성을 얻을 수 있습니다

귀하의 교육에 더 많은 TPU 코어를 추가하십시오 마틴은 실제 확장 성을 보여줄 것입니다 나중에 결과 앞서 언급했듯이 TensorFlow 사용자 전체 TPU 포드를 하나의 거대한 컴퓨터로 사용할 수 있습니다 그 안에 수천 개의 TPU 코어가 있습니다

따라서 단일 컴퓨터를 사용하는 것만 큼 쉽습니다 예를 들어 Keras 코드가 단일 TPU에서 실행되는 경우, 또한 변경없이 2,000 TPU 코어에서 실행됩니다 마틴이 이전에 보여준 것과 정확히 같은 코드입니다 따라서 데이터의 모든 복잡성 평행 훈련, 예를 들어 훈련 분리 데이터를 여러 개의 TPU에 저장하거나 공유 동일한 매개 변수는 모두 TPU 포드 (pods)의 상호 연결 (interconnect) XLA 컴파일러 및 새로운 TPUStrategy TensorFlow 114의 API 바꿀 수있는 한 가지는 배치 크기입니다

마틴이 말했듯이, TPU 코어는 매트릭스 프로세서 이것은 128 x 128 매트릭스 곱셈기를가집니다 그래서 보통, 당신은 최고의 성능을 얻을 것입니다 배치 크기를 TPU의 128 배로 설정함으로써 코어 10 개의 TPU 코어가 있다면 1,280이 될 것입니다 TPU 포드의 장점은 교육 시간 뿐만이 아닙니다 또한 거대 모듈의 교육을 가능하게합니다

메쉬 TensorFlow를 사용하여 데이터 병렬은 분산 된 교육의 보편적 인 방법이었습니다 하지만 한 가지 단점이 있습니다 그것은 큰 모델을 훈련시킬 수 없다 모든 부서가 모든 GPU와 공유되기 때문에 또는 TPUs를 사용하면 적합하지 않은 큰 모델을 가져올 수 없습니다 하나의 GPU 또는 TPU의 메모리에 저장합니다

그래서 분산 교육이라는 또 다른 방법이 있습니다 병렬 모델 병렬 모델을 사용하면 거대한 모델을 분리 할 수 ​​있습니다 여러 GPU 또는 TPU에 훨씬 더 큰 모델을 훈련시킬 수 있습니다 그러나 그것은 대중적인 방법이 아니었다

왜? 구현하기가 훨씬 어렵 기 때문입니다 다이어그램에서 볼 수 있듯이 모든 통신을 구현해야한다 모델의 일부분 사이 그것은 모델 사이에 바느질과 같습니다 그리고 다시 복잡한 클러스터를 설정해야합니다

많은 경우에 커뮤니케이션 모델 사이 수십만 명이 있다면 CPU 또는 GPU 또는 TPU 코어의 그 큰 오버 헤드가 될 것입니다 그렇기 때문에 모델 병렬 모델은 그렇지 않습니다 너무 인기가있어 이러한 문제를 해결하기 위해 TensorFlow 팀 Mesh TensorFlow라는 새로운 라이브러리를 개발했습니다

이것은 분산 된 교육의 새로운 방식입니다 다수의 컴퓨팅 노드들과 함께, TPU 포드, 다중 GPU 또는 다중 CPU와 같은 여러 가지 기능을 제공합니다 TensorFlow는 추상화 계층을 제공합니다 이러한 컴퓨팅 노드를 논리적 n 차원 망사 Mesh TensorFlow는 이제 오픈 소스로 사용할 수 있습니다

코드는 TensorFlow GitHub 저장소에 있습니다 이미징에서 어떻게 작동하는지 보려면, 당신은 간단한 신경 네트워크를 가질 수 있습니다 이것은 MNIST 모델을 인식하기위한 것입니다 이 네트워크의 배치 크기는 512, 및 데이터 차원을 784로 정의하고, 하나의 숨겨진 계층 100 개의 노드로 구성되며 10 개의 클래스로 출력됩니다 그리고 당신이 그 모델로 그 네트워크를 훈련시키고 자한다면 병렬, 당신은 단지 지정할 수 있습니다, 나 매개 변수를 4 개의 TPU로 분할하여 메쉬로 분할하려고합니다

TensorFlow, 그게 전부 야 당신은 어떻게 생각할 필요가 없습니다 분할 모델 간의 통신 구현 통신 오버 헤드에 대해 걱정할 필요가 있습니다 어떤 종류의 코드를 작성할 것입니까? 다음은 모델 병렬을 사용하는 코드입니다 처음에는 치수를 정의해야합니다

데이터와 모델 모두의 이 코드에서는 배치 치수를 512로 정의하고, 데이터의 크기는 784 개이며, 숨겨진 레이어에는 100 개의 노드와 10 개의 클래스가 있습니다 그런 다음 자신의 네트워크를 정의합니다 두 세트의 가중치와 같은 Mesh TensorFlow API를 사용하여 하나의 숨겨진 레이어, 그리고 하나의 로그와 손실 함수, 이러한 차원을 사용하여 마지막으로 메쉬에있는 TPU 또는 GPU의 수를 정의하고, 그리고 당신이 사용하고자하는 레이아웃 규칙은 무엇입니까? 이 코드 예제에서는 숨겨진 레이어를 정의하고 있습니다 모형 매개 변수를 4 개로 분할하기위한 치수 TPUs 그리고 그게 다야

Mesh TensorFlow가이 코드를 살펴볼 수 있도록 자동으로 모델 매개 변수를 4 개로 나눕니다 TPUs 그리고 모든 TPUs와 동일한 교육 데이터를 공유합니다 데이터와 모델을 병렬로 결합 할 수도 있습니다 예를 들어 다음과 같이 2D 메쉬를 정의 할 수 있습니다

그리고 당신은 메쉬의 행을 데이터 병렬로 사용합니다 메쉬 또는 모델 병렬의 열을 사용하고, 그래서 당신은 그들 모두로부터 이익을 얻을 수 있습니다 Mesh TensorFlow를 사용하여 쉽게 정의 할 수 있습니다 배치 크기를 지정할 수 있습니다 열에 대한 열 및 숨겨진 레이어 크기 이것은 메쉬를 사용하는 예제입니다

트랜스포머 모델 교육을위한 TensorFlow 트랜스포머 모델은 매우 대중적인 언어 모델입니다 나는 변압기 모델에 대해 더 깊이 들어 가지 않습니다 하지만 알 수 있듯이지도 작성이 매우 쉽습니다 변환기 모델의 각 계층 메쉬 TensorFlow의 레이어로드 대형 데이터와 대형 모델을 효율적으로 매핑 할 수 있습니다

수십만 개의 TPU 코어에 통합 메쉬 TensorFlow를 사용하여 그렇다면 이점은 무엇입니까? TPU 포드와 함께 실행되는 Mesh TensorFlow를 사용하면, Google AI 팀이 언어 모듈을 교육 할 수있었습니다 및 10 억 단어 규모의 번역 모델을 제공합니다 그리고 그들은 최첨단 점수를 얻을 수있었습니다 그 번호에서 볼 수 있듯이

따라서 사용 사례의 경우 모델이 클수록 당신이 얻는 정확성 TPU 포드와 평행 한 모델은 큰 장점을 제공합니다 그 최첨단 점수를 달성하는 데 도움이됩니다 대규모 모델의 또 다른 활용 사례를 살펴 보겠습니다 병렬 난 그냥 BigGAN 전화

그리고 나는 GAN이 무엇인지 GAN이 어떻게 작용하는지 더 깊이 생각하지 않습니다 그러나 여기에 기본적인 아이디어가 있습니다 두 개의 정의 된 네트워크가 있습니다 하나는 discriminator D라고하고 다른 하나는 생성기 G라고합니다 그리고 손실 함수를 정의합니다

D가 이미지인지 아닌지를 인식하도록 훈련되어야한다 가짜 이미지 또는 실제 이미지 동시에 발전기가 훈련 될 것입니다 D가 찾을 수 없도록 현실적인 이미지를 생성한다 그것은 가짜입니다

그것은 당신이 그 두 사람과 놀고있는 미니 맥스 게임과 같습니다 네트워크 그리고 결국에는 일반 G 사진 사실적인 가짜 이미지를 생성 할 수 있습니다 인공 이미지 데모 비디오를 살펴 보겠습니다

그래서 이것은 큰 스포일러가 아닙니다 나는 이미 더 큰 모델을로드했다 그것은 TPU 포드에서 훈련되었습니다 보시다시피 이들 모두입니다 인공 합성 이미지를 고품질로

카테고리를 지정할 수도 있습니다 타조와 같은 생성 된 이미지의 타조 이미지를 생성 할 수 있습니다 이것들은 모두 합성 인공 이미지입니다 그들 중 누구도 진짜가 아닙니다 그리고 BigGAN은 소위 잠재 공간을 가질 수 있기 때문에 그 이미지를 생성 할 씨앗이 있고, 당신은 두 개의 씨앗 사이를 삽입 할 수 있습니다 이 예제에서는 보간 중입니다

골든 리트리버와 라사 사이 그리고 다른 조합을 시도해 볼 수 있습니다 보간의 서쪽 고지 화이트 테리어 골든 리트리버 다시 말하지만, 모두 가짜 이미지입니다 그래서이 더 큰 모델은 TPU 버전 3으로 훈련되었습니다

포드 512 코어 그리고 그것은 24 시간에서 48 시간이 걸렸습니다 왜 BigGAN이 그렇게 많은 TPU 코어와 오랜 시간이 걸리는지? 이유는 모델 크기와 배치 크기입니다 GAN 모델에 의해 측정 된 GAN 모델의 품질은, 시작 점수 또는 IS 점수로 측정됩니다 그것은 얼마나 많은 초기 모델을 나타냅니다 그 이미지가 진짜라고 생각합니다

또한 생성 된 이미지의 다양성을 나타냅니다 BigGAN 신문에 따르면 당신이 가지고있을 때 더 좋은 IS 점수 모델의 더 많은 매개 변수 및시기 더 큰 배치 크기를 사용하고 있습니다 즉, 더 큰 스케일의 모델은 병렬입니다 수백 개의 TPU 코어에서 BigGAN 모델에 필수적입니다 생성 된 이미지의 품질을 향상시킬 수 있습니다

그래서 두 가지 유스 케이스를 보았습니다 BigGAN 유스 케이스 및 언어 모델 유스 케이스 그리고 그 모델의 첫 번째 응용 프로그램입니다 TPU 포드와 평행을 이룬다 그러나 그들은 단지 시작에 불과합니다 그래서 TPU 포드는 지금부터 모든 사람들이 이용할 수 있습니다

그래서 우리는 점점 더 흥미 진진한 모습을 기대합니다 새 TPU 포드 사용자가 제공 한 사용 사례 또한 응용 프로그램에서 그래서 그것이 내 부분을위한 것입니다 마틴으로 돌아 가라 MARTIN GORNER : 이제 데모를 확인해보십시오

우리 모형이 실제로 훈련 되었습니까? 여기를 확인해 보면 훈련이 끝난 것처럼 보입니다 저장된 모델이 저장되었습니다 그래서해야 할 유일한 일은 이 모델이 실제로 뭔가를 예측할 수 있는지 확인합니다 그래서 두 번째 머신에서 똑같은 모델을 다시로드 할 것입니다 승인

나는 그것이 하나다고 믿는다 가서 다시로드하자 그래서 이번에는 훈련을 건너 뛰고 여기로 가겠습니다 추론과 로딩 죄송합니다, 죄송합니다

데모 신이 오늘 나와 함께 할 것이기를 바랍니다 괜찮아 내가 잘못된 디렉토리를로드하고 있기 때문입니다 데모 신은 나와 거의 같다 내 모델이 저장되었던 곳이 바로이 곳입니다

괜찮아 예 과연 그것은 같지 않았습니다 미안합니다

훈련도, 단지 추론도 그리고 이번에는 내 모델이로드되는 것처럼 보입니다 일단로드되면 실제로 볼 수 있는지 이미지에서 동물을 감지하면 여기 있습니다 그래서이 표범은 실제로 표범입니다 이 새는 새입니다

사자는 사자입니다 이것은 매우 까다로운 이미지입니다 그래서 나는 체리 선택 이미지가 아니라 당신을 보여주고 있습니다 이것은 무대에서 훈련 한 모델입니다 여기 있습니다

완벽한 모델은 없습니다 우리는이 같은 잘못된 탐지를 보게 될 것입니다 하지만 까다로운 문제입니다 그것은 삽화입니다 실제 사자가 아닙니다

표범이 자리하고있어 사자가 자리하고있어 그리고 권투가 실제로 아주 잘 작동하는 것을보십시오 표범은 이미지에서 완벽하게 식별되었습니다 이제 더 도전적인 것으로 넘어 갑시다

심지어이 풍선 예술품 사자가 확인되었습니다, 항상 그런 것은 아닙니다 이것은 복잡한 이미지입니다 새들의 무리 그래서 모든 것을 보지 못한다는 것을 알 수 있습니다 그러나 그들 모두는 최소한 새들입니다

그것은 꽤 좋은 직업이다 표범은 괜찮아 아, 그리고 우리가 가진 가장 복잡한 것입니다 말과 소가있다 음, 여기에 몇 가지 잘못된 탐지가 시작됩니다

물론 그 암소는 돼지가 아닙니다 내가 말했듯이, 어떤 모델도 완벽하지 않습니다 하지만 여기 호랑이는 호랑이입니다 우리 두 개의 귀여운 판다 있어요 그리고 그 2 개의 귀여운 팬더는 실제로 아주 어렵다

아기 팬더이기 때문입니다 그리고 저는이 모델이 300,000 이미지 데이터 세트에 많은 아기 동물이 있습니다 그래서 두 팬더를 찾을 수있어서 기쁩니다 그래서 뒤로 물러서서, 너를주는 것으로 끝내자 해당 모델에 대한 몇 가지 피드와 속도

그래서 여기에서이 모델은 RetinaNet 50 백본을 가지고 있습니다 박스를 생성 한 모든 감지 레이어를 더한 것입니다 그리고 우리는 128 코어를 가진 TPU v3 포드에서이를 교육했습니다 20 분 안에 끝났어 당신은 저를 믿을 필요가 없습니다

보여 드리죠 여기 타이머를 내 대본을 읽도록했습니다 19 분 18 초 그래서 나는 속이고 있지 않습니다 이것은 살아 있었다

그러나 나는 또한이 모델을 작은 포드에서 실행할 수 있습니다 사실, TPU v2-32에서 시도했습니다 이 차트에서이 축의 속도를 볼 수 있습니다 이 축의 시간 이것은 TPU v2-32가 실제로는 당신을 보여주는 것입니다 갖고있는 매우 유용한 도구

우리는 지금까지 거대한 모델에 대해 이야기 해왔다 그러나 이것이 거대한 모델인지 여부는 논쟁의 여지가 있습니다 이것은 1 년 전에 거대한 모델이었습니다 오늘, 더 나은 도구로, 나는 그것을 훈련시킬 수있다 상당히 겸손한 TPU v2 32 코어 포드 (pod)에서 한 시간 만에

따라서 개인 데이터 과학자 인 경우 라 할지라도, 그건 내가 쓸모있는 도구가 될 때 유용하다 나는 이런 모델에 대한 일련의 훈련을 할 필요가있다 누군가 동물 탐지 모델을 원하기 때문입니다 그리고 훈련을 1 시간으로 가져 가라 공간 또는 20 분 공간 나를 훨씬 빠르게 작업하고 훨씬 더 빠르게 반복 할 수 있습니다

hyperparemeters에, 미세 조정에, 등등 하나의 TPU v3에서 볼 수 있습니다 결론입니다 그리고 우리가 이것을 GPU에서 훈련한다면 – 처음부터 우리의 경험을 기억하십시오 하나의 TPU v2, 대략 5 GPU

따라서 1 TPU v3, 대략 10 GPU 그래서 GPU 라인은 가장 낮은 것의 10 분의 1이 될 것입니다 이 그래프의 선 간신히 거기 등록 할 것이기 때문에 나는 그것을 두지 않았다 그것은 당신에게 규모의 변화를 보여줍니다

TPU를 사용하여 모델을 교육 할 수 있습니다 이것에 대해 궁금해하실 것입니다 따라서 규모를 확장 할 때 발생할 수있는 한 가지 학습 속도 일정을 조정해야한다는 것입니다 이것은 실제로 학습 속도 일정입니다 필자는 128 코어 TPU 포드에서 모델을 교육하는 데 익숙했습니다

그럴 수도 있기 때문에 단지 몇 마디 만 당신이 본 가장 평범한 학습 속도 일정 이 경사가 있습니다 따라서 두 번째 부분은 기하 급수적 인 감소입니다 그건 상당히 표준입니다 그러나 부분적인 상승은, 우리가 ResNet-50에서 시작하여 초기화 됨 미리 훈련 된 무게로

그러나 우리는 여전히 그 무게를 훈련 가능한 상태로 두었습니다 그래서 우리는 모든 것을 훈련하고 있습니다 그것은 양도 학습이 아닙니다 사전 훈련 된 ResNet-50을 미세하게 조정하는 것입니다 그리고 네가 그렇게 할 때, 너는 훈련한다

우리가 여기에서하는 것처럼 큰 배치를 사용하여 매우 빠르며, 여기서 배치 크기는 64 배 128입니다 그래서 매우 큰 배치 크기입니다 실제로 사전 훈련 된 가중치를 깰 수도 있습니다 당신의 정밀도에 해를 끼치는 방식으로 그래서 기간을 늘리는 것이 일반적입니다

그 초기 훈련에서 네트워크, 단계, 그것이 무엇을하는지 모를 때, 정보를 완전히 파괴하지 않는다 훈련 전의 무게로 그래서 우리가 해냈습니다 우리는이 모델을 20 분 안에 무대에서 훈련 시켰습니다 그리고 데모가 효과적이었습니다

정말 기쁩니다 그래서 이것이 끝입니다 우리가 본 것은 TPUs와 TPU 포드입니다 빨리, 네 그러나 대부분 비용 효율적입니다

매우 비용 효과적인 방법과 좋은 도구 어떤 데이터 과학자도 가질 수 있습니다 또한, 특히 매우 큰 모델의 경우, 과거에는 큰 모델이었던 ResNet-50과 같은 오늘날의 정상적인 모델입니다 [알아들을 수 없는] 그것은 매우 유용한 도구입니다 그런 다음 Cloud TPU 포드를 클릭하면 데이터뿐만 아니라 모델 병렬 처리를 가능하게하고, 이 새로운 라이브러리 인 Mesh TensorFlow를 사용합니다

여기에 몇 가지 링크가있는 자세한 정보가 있습니다 더 알고 싶다면 예, 사진을 찍을 수 있습니다 더 궁금한 점이 있으시면 AI ML 포드, 빨간색, 하나의 TPU 랙 앞 그래서 이걸 라이브로 볼 수 있고 그것이 어떤 종류의 컴퓨터인지 느낀다

그리고 그걸로, 대단히 감사합니다 [박수 갈채] [음악 재생]

Hello World – Machine Learning Recipes #1

여섯 줄의 코딩으로 첫 번째 머신 러닝 프로그램을 작성해 봅시다 제 이름은 조쉬 고든이고요, 오늘 저는 머신 러닝으로 Hello World를 작성하기까지 안내하려 합니다

이 시리즈의 초기 몇 개의 에피소드들은 여러분이 머신 러닝을 기초부터 시작하는 방법을 알려 드릴 겁니다 우선 오픈소스 라이브러리 두 가지를 다룰 것입니다 사이킷-런(Scikit-learn)과 텐소플로우(TensorFlow)입니다 잠시 후에 사이킷을 실제로 해보겠습니다 그러나 우선 머신 러닝이 무엇이고 왜 중요한지를 잠시 이야기해 볼게요

머신 러닝은 인공지능의 한 분야입니다 초기 AI 프로그래머들은 한 가지에만 특화시켰습니다 예를 들면 딥 블루는 체스를 하고 챔피언 경지까지 올라갔지만 할 줄 아는 것은 그것 뿐이었습니다 오늘날 필요로 하는 것은 하나의 프로그램을 만들어서 내용 수정 없이 다양한 문제들을 해결하는 것이지요 알파고는 대표적인 예입니다

알파고는 세계 바둑 챔피언쉽 경기를 했지요 그러나 비슷한 소프트웨어가 아타리 게임하는 법도 배우지요 머신 러닝을 통해서 그게 가능합니다 머신 러닝은 사례와 경험을 통해 배우는 알고리즘이죠 하드코딩된 룰에 의존하는 게 아닙니다

그래서 예술의 경지라고 하지요 오늘 코딩을 시작하기 위해 간단한 예를 보겠습니다 언뜻 쉬워 보이지만 머신 러닝 없이는 풀수 없는 문제가 있습니다 사과와 오랜지의 차이를 말할 수 있는 코드를 작성할 수 있을까요? 가령 이미지 파일을 입력하면 분석을 통해 과일의 종류를 말해 주는 프로그램을 작성한다고 합시다 여러분은 어떻게 이 문제를 풀까요? 수많은 제각각의 룰들을 작성해야 할 겁니다

예를 들면 오랜지 색의 픽셀의 수와 초록색의 픽셀의 수를 비교하는 코드를 작성할 수도 있겠네요 그 비율은 과일의 종류에 대한 힌트를 주겠지요 이런 간단한 이미지에서는 잘 됩니다 그러나 문제에 깊이 들어가게 되면 실제 세계는 복잡하고 여러분의 룰은 깨져버립니다 흑백 사진일 때나 오랜지도 사과도 없을 때 대응할 수 있는 코드 작성이 가능할까요? 사실 여러분이 어떤 코드를 작성하더라도 그 룰과 어긋나는 이미지가 항상 있게 마련이지요

사과의 오랜지의 차이를 말해 주는데도 어마어마한 양의 룰을 작성해야 합니다 또 다른 문제는 매번 반복해야 한다는 것입니다 분명히 좀 더 나은 게 필요합니다 이 문제를 해결하려면 우리가 손수 입력을 하지 않아도 규칙을 정립하는 알고리듬이 필요합니다 그러기 위해 분류자(Classifier)를 훈련시킵니다

우선은 분류자를 함수로 생각해도 됩니다 데이터를 입력으로 받으면 라벨을 부여하고 출력해 줍니다 예를 들면 내가 사진 한 장을 가지고 사과인지 오랜지인지 분류한다고 합시다 아니면 이메일을 스팸인지 아닌지로 분류한다고 합시다 분류자를 자동으로 작성하는 기술은 지도 학습이라고 합니다

해결할 문제의 예를 가지고 시작해 볼까요 코드를 작성하기 위해 사이킷-런을 사용하겠습니다 여기서 라이브러리를 다운로드하고 설치하겠습니다 하는 방법은 몇 가지가 있습니다 저의 경우는 아나콘다를 사용하는 게 가장 쉬웠습니다

이걸 사용하면 모든 의존성이 세팅되고 플렛폼을 가리지 않고 잘 됩니다 비디오에서 빨리 돌려서 초고속으로 다운로드하고 설치했습니다 설치가 완료되면 파이썬 스크립트를 돌리고 SK 런을 임포트하면 모든 게 제대로 작동하는지 테스트할 수 있습니다 지금까지 잘 됐다면 이것이 우리 프로그램의 첫줄이고 이제 됐습니다 지도 학습을 사용하려면 표준 절차 몇 단계를 따라야 합니다

1단계는 훈련 데이터 모으기입니다 이들 예는 우리가 해결하려는 문제들입니다 우리의 문제를 해결하기 위해 과일을 분류하는 함수를 작성하겠습니다 간단히 말해서, 과일의 특징을 입력으로 받고 무게나 표면 형태와 같은 특징을 보고 사과인지 오랜지인지 추측하여 출력하는 것입니다 훈련 데이터를 모으기 위해 과수원으로 향합니다

서로 다른 사과와 오랜지를 관찰하고 특징을 표현하는 측정 값을 표에 적습니다 머신 러닝에서는 이들 측정값을 특징이라고 합니다 우선은 간단하게 두 가지만 사용했습니다 무게는 몇 그램이고 표면은 거친지 부드러운지입니다 특징을 잘 잡게 되면 서로 다른 종류의 과일을 구분하는 게 쉬워집니다

훈련 데이터는 줄 하나에 하나의 예가 들어갑니다 개별 과일에 대한 설명입니다 마지막 칼럼은 라벨이라고 합니다 라벨은 그 줄이 어떤 과일인지 구분해 주는데 현재는 두 가지 가능성이 있습니다– 사과와 오랜지 전체 테이블은 훈련 데이터입니다

이 모든 것이 분류자가 학습해야 할 예제 전체라고 보시면 됩니다 학습 데이터가 많을 수록 더 나은 분류자가 만들어집니다 이제 학습 데이터를 코드로 작성해 봅시다 features와 labels 두 가지 변수를 사용하겠습니다 features는 처음 두 개의 칼럼을 포함하고 labels는 나머지를 포함합니다

features는 분류자에 입력되는 것이라면 labels는 출력되는 것입니다 모든 features의 변수형을 문자열에서 정수형으로 바꿔 0은 거친 것, 1은 부드러운 것으로 사용하겠습니다 labels에 대해서도 똑같이 적용해서 0은 사과이고 1은 오랜지입니다 프로그램에서는 2~3 라인에 해당합니다 두 번째 단계는 이들 예제들을 분류자 훈련에 사용하는 것입니다

우리가 시작할 분류자 타입은 결정 트리(tree)라고 부릅니다 어떻게 돌아가는지는 다음 편에서 자세히 보실 수 있습니다 당장은 분류자는 규칙을 담은 박스라고 생각하면 되겠습니다 그래서 수많은 종류의 분류자가 있지만 입력과 출력 형식은 항상 같은 것입니다 트리를 임포트해 보겠습니다

이어서 스크립트 상의 4번째 줄에 분류자를 생성하겠습니다 현재는 비어 있는 규칙 박스입니다 아직 사과와 오랜지에 대해 아무것도 아는 게 없습니다 훈련을 시키기 위해 학습 알고리듬이 필요합니다 분류자가 규칙의 상자라면 학습 알고리듬은 그것을 생성하는 과정이라고 할 수 있습니다

훈련 데이터의 규칙성을 파악하여 규칙 상자를 생성하는 것이지요 예를 들면, 오랜지가 더 무거운 경향이 발견된다면 무게가 더 나가는 과일이 오랜지일 것이라는 룰을 생성하는 것입니다 사이킷에서는 학습 알고리듬은 구분자 객체에 포함되고 핏(Fit)이라 부릅니다 핏이란 "데이터에서 패턴을 발견하다"란 뜻입니다 내부적으로 이런 기능이 어떻게 작동하는지는 다음 편에서 자세히 보도록 하겠습니다

일단 훈련을 받은 분류자를 생성했습니다 이제는 한 번 돌려 보고 새로운 과일을 분류하는 데 사용해 보겠습니다 분류자에 입력할 것들은 새로운 사례의 특징들입니다 가령 150그램의 거친 촉감의 과일을 분류한다고 합시다 사과라면 0, 오랜지라면 1이 출력될 것입니다

입력 단추를 누르고 분류자의 예측을 보기 전에 잠깐 생각해 봅시다 만일 여러분에게 예측하라 한다면 뭐라고 출력이 될 것 같습니까? 예측을 하려면 이 과일을 훈련 데이터와 비교해야 합니다 아무래도 오랜지에 가까워 보입니다 무겁고 표피가 거칠기 때문입니다 일단 그렇게 예측을 하고 입력 단추를 누르면 분류자 역시 같은 예측을 보여줍니다

이게 다 잘 됐다면 드디어 첫 번째 머신 러닝 프로그램을 하신 겁니다 훈련 데이터만 변경하면 새로운 문제에 대한 분류자를 생성할 수 있습니다 그래서 각 문제별로 새로운 규칙을 작성하는 것에 비해 재사용이 용이한 방법론이라 할 수 있지요 그런데 훈련 데이터로 과일을 사진을 사용하지 않고 특징 테이블을 사용하는지 궁금하실 겁니다 물론 사진을 사용할 수도 있습니다

그건 다음 편에 해 보도록 하겠습니다 하지만 대체로 이러한 방식이 일반적인 방법입니다 머신 러닝 프로그래밍은 그다지 어렵지 않다는 이점이 있습니다 그러나 잘 사용하기 위해서는 몇 가지 중요한 개념을 이해할 필요가 있습니다 그건 다음 편에서 안내해 드리도록 하지요

시청해 주셔서 감사합니다 다음에 뵙겠습니다

Machine Learning and Human Bias

연설자 : 게임을하자 눈을 감고 신발을 그립니다

승인 누구가이 사진을 찍었습니까? 이? 이것은 어떤가요? 우리는 이유를 알지 못할 수도 있지만 우리 각자 다른 신발보다 한 신발에 편향됩니다 이제 컴퓨터를 가르치 려한다고 상상해보십시오 구두를 알아볼 수 있습니다 당신은 자신의 편견에 노출 될 수 있습니다

그것이 기계 학습에서 편향이 발생하는 방법입니다 하지만 먼저, 기계 학습이란 무엇입니까? 오늘날 우리가 사용하는 많은 기술에 사용됩니다 기계 학습은 우리가 장소를 찾는데 도움이되며, 우리에게 제안을하고, 물건을 번역하며, 심지어 네가하는 말을 이해한다 어떻게 작동합니까? 전통적인 프로그래밍으로 사람들은 문제에 대한 솔루션을 단계별로 손으로 코딩하십시오 컴퓨터 학습을 통해 컴퓨터는 솔루션을 학습합니다

데이터에서 패턴을 찾아서 인간 편견이 없다고 생각하기 쉽습니다 하지만 뭔가가 데이터를 기반으로하기 때문에 자동으로 중립적 인 것은 아닙니다 좋은 의도로도 분리 할 수 ​​없습니다 우리 자신의 인간 편견으로부터 그래서 인간의 편견은 기술의 일부가됩니다 우리는 여러 가지 방법으로 창조합니다

이 최근 게임과 같은 상호 작용 바이어스가 있습니다 사람들이 컴퓨터 용 신발을 가져 오라고 요청한 곳입니다 대부분의 사람들은 이런 것들을 그렸습니다 더 많은 사람들이 게임과 상호 작용할 때, 컴퓨터는 이들을 인식하지 못했습니다 잠정적 인 편향 – 예를 들어 컴퓨터를 물리학 자의 모습, 그리고 사진 사용 과거 물리학 자, 당신의 알고리즘 남자쪽으로 기울어지는 잠복 편향으로 끝날 것입니다

그리고 선택 편견 – 당신이 모델을 훈련한다고 말하라 얼굴을 알아볼 수 있습니다 인터넷이나 자신의 사진에서 이미지를 가져올 지 여부 도서관, 당신을 선택하고 있습니까? 모두를 대표하는 사진? 가장 진보 된 제품 중 일부는 기계 학습을 사용하기 때문에, 우리는 그 기술을 막기 위해 노력해 왔습니다 부정적인 인간 편견을 영속시키는 것에서 – 공격 태클이나 명백한 오해의 소지가 있음 검색의 상단에 표시되는 정보 결과 페이지에서 검색 창에 피드백 도구 추가 그래서 사람들은 증오 또는 부적절한 태도를 취할 수 있습니다 제안 자동 완성

복잡한 문제이며 마법의 총알이 없습니다 그러나 그것은 우리 모두가 알고 있다는 것으로 시작됩니다 그래서 우리 모두는 대화의 일부가 될 수 있습니다 왜냐하면 기술은 모든 사람들을 위해 작동해야하기 때문입니다

How machine learning helps identify potholes on Los Angeles roads

알레한드라 바스케스: 안녕하세요, 저는 알레한드라에요 에릭손 에르난데스: 저는 에릭손입니다 알레한드라 바스케스: 저희는 머신러닝을 활용해 LA 도로의 움푹 팬 곳 즉, 포트홀을 찾아내고 있어요 에릭손 에르난데스: LA에 있는 국도와 고속도로는 길이가 11,900km가 넘어요 알레한드라 바스케스: 도로가 이렇게 많은 만큼 수리해야 할 부분도 많죠 에릭손 에르난데스: 지금은 건설 노동자들이 도로에 위험한 포트홀이나 균열이 있는지 일일이 검사하거나 사람들의 신고에 의존해야 하는데 그러려면 시간이 많이 걸리죠 알레한드라 바스케스: 로욜라 메리마운트 대학에서 공부하면서 저희는 LA 전역에 걸쳐 도로 위 포트홀을 더 빠르게 찾아내는 방법을 연구하기 시작했어요 에릭손 에르난데스: 우선 데이터가 필요했죠 그래서 자동차에 카메라를 달고 돌아다니면서 여러 국도와 고속도로를 촬영했어요 알레한드라 바스케스: 그런 다음 Google의 오픈소스 머신러닝 도구인 TensorFlow를 사용해 도로 위 포트홀이나 균열 혹은 다른 이상을 아주 빠르고 정확하게 파악하는 모델을 개발했어요 따라서 작업자들이 포트홀을 찾는 데 드는 시간을 줄이고 포트홀을 수리하는 데 집중할 수 있어요

Applied Machine Learning with Peter Norvig, Director of Research, Google AI

[음악 재생] 여러분, 환영합니다 아침 일찍 일어나서 깨어있게 해줘서 고마워

우리가하는 일에 대한 약간의 개요를주고 싶다 기업 접근 방식 측면에서 본다 기계 학습의 문제 그리고 여러분 모두 표준 모델을 알고 있습니다 너는 약간 자료, 몇몇 그림, 당신은 그것에 몇 개의 레이블을 붙인다

그리고 너는 그 TensorFlow 물건을 던져라 이익을 얻으십시오 어떻게 그럴 수 있죠? 항상 직접적인 것은 아닙니다 때로는 조금 더 복잡합니다 왜 그런가요? 음, 그런데 놀랄만 한 점이 있습니다

첫 번째 일은 우리가 외출 중이라는 것입니다 우리는 당신과 다른 사람들과 같은 회사와 이야기를 해왔습니다 너는 그 어려움이 무엇이라고 생각하니? 될 것? 당신이해야 할 모든 부분이 있습니다 목표를 정의하고 데이터를 수집하며, 인프라 구축, ML 알고리즘 최적화, 그것을 귀하의 제품에 통합하십시오 사람들의 기대는 음, 어려운 부분입니다

그 알고리즘 물건이 될 것입니다 그 모든 수학은 정말 어려울거야, 그렇지? 그리고 나서 그들은 나가서 실제로 그것을합니다 그리고 현실은 이것과 더 비슷합니다 수학 부분은 쉬운 부분이었습니다 그리고 어려운 부분은 데이터를 가져 오는 중입니다

인프라를 구축 한 다음 기계끼리 끼워 맞춤 통합 당신의 제품의 나머지 부분과 함께 학습 부분 그리고 수학 부분은 조금 작습니다 그래서 그것은 정말로 당신이 가진 일을 뒤엎는 것입니다 네가해야 할 일에서해야 할 일 그래서 우리가 함께하려고했던 것 이 현실과 오히려 일치하는 방법론입니다

기대치와 일치합니다 여기 몇 가지 함정이 반복해서 나타납니다 그래서, 모두들, 글쎄, 기계 학습 더 빨리, 더 좋게, 더 싸게 갈 것입니다 괜찮을거야 그렇지? 그리고 때때로 그것은 정말로 있습니다

때로는 수백 배 더 빠르게 작업을 수행합니다 그렇지 않으면 가질 수있는 것보다 가끔은 네가하는 일을하는거야 기계 학습 없이는 전혀 할 수 없었습니다 하지만 다른 때에는 더 길게 끝납니다 당신이하지 않은 방법론에서 뭔가 새로운 것을하고 있기 때문에 알아

그래서 처음에는 뭔가를하는 것이 어렵습니다 올바른 데이터를 가지고 있는지에 대한 문제가 있습니다 당신이 그것을 적절하게 선별했는지 등등 때때로 사람들은 그것을 잊어 버립니다 이 아이디어는 그것이 전부 또는 아님, 너는 기계 학습을하고 있거나 너는 매뉴얼을하고있다

그것은 아마도 그것을 보는 올바른 방법이 아닙니다 당신이 그것을보고 있어야하는 방법 어떤 하위 문제에 적절한 것이 무엇입니까? 그리고 그것이 100 % 자동화 된 것이 아니라고 말하는 것을 두려워하지 마십시오 아직 루프에 어떤 인간이 있다고 적절한 시점에 올바른 제품이 무엇인지 파악합니다 따라서 여기에 내가 최적화 할 수있는 척도가 있다고 말하는 것이 유혹적입니다

~ 99 % 하지만 내 제품을 만드는 데 도움이되지는 않습니다 그것은 당신이 최적화하고 싶은 것이 아닙니다 그리고 네가하는 것에 대한 질문은 사내에서 할 일, 사용할 도구, 그리고 당신은 그것을 어느 레벨에서 사용할지를 결정해야합니다 여기에는 많은 선택 사항이 있습니다

혼자서 모든 것을 만들 수 있습니다 이러한 사전 훈련 된 모델을 사용할 수 있습니다 다양한 회사들이 제공하고 있습니다 올바른 믹스가 무엇인지 알아 냈습니다 또 다른 걸림돌이되었습니다

이제 나는 조금 뒤로 물러서 고 싶다 기존 소프트웨어와 다른 점을 살펴보십시오 및 기계 학습 소프트웨어 그래서 전통적인 소프트웨어에서, 우리는 시작합니다 우리에게는 엔지니어 또는 엔지니어 팀이 있습니다

그들의 책상에 앉아 그리고 그들은 아이디어를 얻습니다 그런 다음 모든 의사 결정 포인트를 수동으로 코딩합니다 우리가 묘사해야 할 모든 가능한 것들 컴퓨터에 무엇을 할 것인가 그리고 어려움은 많은 다른 길, 그리고 너는 가지고있다

모두가 작동하는지 확인하십시오 그리고 그것은 전통적인 소프트웨어 수학 과학을 만듭니다 우리는 기본적으로 우리의 프로그램이 올바른지 증명하려고 노력하고 있습니다 물론, 실제 생활에서 우리는 단지 작은 장난감 프로그램을 위해 그렇게하십시오 우리는 실제 프로그램을 실제로 증명하지 않습니다

그러나 우리는 그 방향을 목표로하고 있습니다 그리고 우리는 불리언 논리를 사용합니다 그리고 우리는 확실하게 노력합니다 기계 학습에서, 그것은 아주 다릅니다 우선 프로그래머가 아닙니다

프로그램을 작성 그것은 프로그램을 작성하는 컴퓨터입니다 아직 인간을위한 장소가 있습니다 그리고 그것은 교사가되어 데이터를로드하고, 학습 방법을 시스템에 가르쳐줍니다 그리고 그것은 기계 학습을 만들고 소프트웨어를 만듭니다

경험적 과학 따라서 수학을하는 것보다 생물학을하는 것이 더 좋습니다 당신은 세계에 대한 이론을 만듭니다 너는 너의 이론을 시험해 그들은 결코 정확하지 않을 것입니다

논리적이고 부울하지 않습니다 그들은 확률 론적이다 그리고 당신은 오히려 불확실성을 포용합니다 그것을 제거하려고 노력하는 것보다 그래서 완전히 다른 사고 방식입니다

그리고 사람들이 그 변화에 적응하는 것이 어려울 수 있습니다 이제 당신이 문제를 바라 보는 방식 외에도, 우리는 방법론에서도 진전을 보였습니다 우리가 제품을 만드는 방법 그래서 우리는 시작했습니다 소프트웨어는 일종의 스튜디오 또는 장인이었습니다

들 차고 건물에 스티브라는 두 명의 남자가 있습니다 훌륭한 회사 그리고 물론, 그들은 나중에 많은 도움을 받았다 하지만 시작은 매우 작은 팀이었습니다

별로 방법론이 없었습니다 너는 바지의 자리에 그걸 다했다 하지만 그때 우리는 당신이 오직 얻을 수 있다는 것을 깨달았습니다 지금까지 그 작은 팀과 그래서 우리는 일종의 공장 모델을 발명했습니다

또는 우리가 말했던 조립 라인 모델, 우리는 어떻게 수천 개의 소프트웨어 팀을 만들 것인가? 엔지니어가 함께 일하니? 음, 그렇게하기 위해서, 우리는 많은 훈련을 강요 할 필요가 있습니다 및 방법론 그리고 우리는 기본적으로 반세기에 걸쳐 그것을 구축했습니다 하지만 이제는 우리가 공장 모델을 필요로하지 않는다고 말하고 있습니다 어쩌면 학교 모델과 같을 수도 있습니다

이제 우리는 교사들에게 가르치게 할 것입니다 컴퓨터가 무엇을 해야할지 그리고 우리는 그것을하기위한 새로운 방법론이 필요할 것입니다 그런데 우리가 가지고있는 도구는 무엇입니까? 그래서 나이가 들어서 프로그래밍을 시작할 때, 나는 실제로 이것들 중 하나를 가졌다 그리고 연필로 작은 흐름도를 그렸습니다

그게 유용하다고 생각한 적은 없지만 숙제에 A를 얻고 싶다면 그것을해야만했습니다 그래서 나는 말했다 그러나 시간이 지남에 따라 우리는 훨씬 더 강력한 도구 세트를 구축했습니다 그리고 이제 우리는이 모든 위대한 것들을 가지고 있습니다 우리에게는 교육 자료 및 방법론이 있습니다

그리고 프로그래머들은보다 생산적 일 수 있습니다 왜냐하면 우리는 반세기가 지났기 때문입니다 방법론 이제 기계 학습에서 우리는 이제 시작하고 있습니다 따라서 우리는이 수준의 도구를 사용합니다

우리는이 고대 도구들을 가지고 있습니다 그리고, 예, 시간이 지남에 따라 더 정교해질 것입니다 그리고 당신은 – 그곳에는 망치가 있고 톱 등이 있습니다 그리고 그들은 당신이 더 잘 될 것이라는 것을 압니다 그러나 우리는 처음부터 정말로 옳습니다

그리고, 우리는 도움이되는 훌륭한 도구를 가지고 있습니다 여기 TensorBoard가 있습니다 그러나 우리는 생태계 전체를 구축하지 않았습니다 우리는 전통적인 소프트웨어를 가지고 있습니다 그럼 어떻게 거기에 갈거야? 우리는 어떻게 기계를위한 방법론을 갖게 될 것인가? 학습 성공? 글쎄, 그것은 우리가 작업하고있는 것들 중 하나입니다

나는 우리가이 블로그에 당신을 가리키고 싶다 "The Lever"에서 일하고있다 더 빠르게 움직이고, 몇 가지 블로그를 살펴볼 수 있습니다 우리는 가지고있다 그리고 우리는 지금이 모든 말씀을 읽을 필요가 없습니다

그러나 그것은 이용 가능할 것이고, 당신은 가서 그것을 볼 수 있습니다 그래서 하나의 실험 아이디어가 있습니다 우리는 우리가 어디로 가고 있는지 정확히 알지 못합니다 그러나 우리는 그것에 대해 걱정하지 않아야합니다 그리고 우리는 신속하게 진전을 시도해야합니다

빠른 실험을하고, 결과를보고, 분석하고, 진행 방향을 변경합니다 제품 관리자가 기계와 통합되는 방식에 대한 아이디어 제품 관리자가 말하기의 규율에 익숙하다 우리가 쌓아야 할 것입니다 우리가 그것을 조각으로 나누는 방법은 다음과 같습니다 얼마나 오래 걸릴지 알아

각 조각을 만들 수 있습니다 나는 최종 제품을 구상 할 수있다 그리고 기계 학습으로, 항상 좋아하는 것은 아닙니다 얼마나 오래 차이가 있기 때문에 그것이 취할 것인가, 아니면 그것이 짝수 일 것인가 구성 요소를 만드는 것이 가능해질 것입니다 그런 다음 데이터는 어디에서 왔습니까? 데이터가 핵심이라면 데이터는 새로운 자본이고 기계 모든 것을 만드는 공장 바닥에 어디로 간다? 그것을 curating하는 과정은 무엇입니까? 데이터가 새로운 금으로 생각할 수도 있습니다

당신은 그 일을 잘 돌보고 싶습니다 당신은 투자하고 있습니다 당신은 올바른 투자를 원한다 올바르게 사용하는 방법을 알고 있어야합니다 그리고 당신은 더 많은 것을 위해 그 블로그를 볼 수 있습니다

그 아이디어 각각에 다시 말하지만 여기에서 다시 참조 할 수 있습니다 그러나 우리는이 다섯 가지 범주의 관점에서 도전을 생각합니다 먼저 기술은 무엇입니까? 이러한 모든 새로운 도구를 사용하고 데이터를 사용하며, 그것을 통해 흐름, 알아내는 어떤 모델이 합리적인지, 그 기술을 배치하는 것입니다

멋진 기술을 사용하는 방법 고객에게 적합한 제품에 적합합니까? 그래서 우리는 여기에 문제가있었습니다 회사 내에서 Google에 많은 일이 일어나고 있습니다 그리고 많은 훌륭한 연구가 진행되고 있습니다 그리고 훌륭한 제품 개발이 많이 있습니다 그러나 우리가 그 두면을 하나로 모으지 않는다면, 우리는 성공하지 못할 것입니다

그래서 저는 연구 책임자로서, 사진 팀이 우리에게 와서 말했습니다 우리는이 끔찍한 성공 재난을 겪습니다 사람들은 사진을 사용하고 있으며 제비 뽑기와 많은 그림을 가져 가고, 지금은 혼란스럽고 정리할 수 없습니다 자신의 사진을 찾을 수 없습니다 우리는 무엇을 할 수 있습니까? 그리고 그들은, 나는 우리가 필요하다고 생각한다고 말했다

인간이 할 수있는 몇 가지 요소입니다 사람들이 모든 사진을 폴더로 쉽게 분류 할 수 있습니다 그리고 우리는 그들에게 말했습니다, 예, 그렇습니다 그 중 일부는 인간의 요인 전문가 우리는 아마 조금 더 나아질 수 있다고 생각합니다

그러나 대신 우리가 자동으로 아무도 아무 시간도 낭비하지 않도록 모든 사진에 라벨을 붙였습니다 그들을 폴더에 넣어? 그리고 그들은 말했다, 당신은 그것을 할 수 있습니까? 나는 그것이 공상 과학이라고 생각했다 그래서 과학자가 인식하는 것의 대화였습니다 이 사람들은 필요와 제품 팀이 있습니다 이 녀석들에게는 기술이 있다는 것을 인정합니다

그리고 그 대화를해야합니다 당신은 그 사람들을 모아야합니다 그렇지 않으면 우리는 그 모든 노력을 낭비했을 것입니다 디자인 문제가 변경 될 수 있습니다 디자인이 어디로 향하는 지 보여주는 좋은 예였습니다

우리가 더 이상 없었던 많은 것을 바꾸는 폴더 구조가 어떻게 생겼는지 걱정 해시 태그는 모두 무엇입니까? 오히려 검색 창을 가질 것이라고 말할 수 있습니다 이제 결과가 어떻게되는지 알아냅니다 당신이 그 수색을 할 때처럼 따라서 사용자 경험은 상당히 다를 것입니다 그리고 나서 사람들의 문제

너 같은 회사에서 불만이 많다 이러한 기계 학습 전문가를 어떻게 고용 할 수 있습니까? 그리고 페이스 북은 그들 모두를 얻었다? 그래서 그들은 밖에 있습니다 그러나 생각할 다른 것 우리가 가진 전문가 중 일부는 당신이 원하는 사람들이 아닙니다 그래서 너는 갈 사람이 필요 없어 톱 컨퍼런스에서 논문을 쓰는 중 새로운 알고리즘을 발명합니다

필요한 도구는 기존 도구를 사용할 수있는 사람입니다 그것들을 하나의 제품으로 합치십시오 그리고 때로는 두 가지 유형의 사람들이 상당히 다릅니다 그리고 알고리즘에 대한 세계의 전문가 인 누군가 제품을 만드는 데 적합한 사람이 아닐 수도 있습니다 그러나 그것을 이해할 수있는 누군가가 그것을 할 수 있습니다

그리고 성장과 관련하여 많은 문제가 있습니다 우리는 기업이 첫 발걸음을 내딛는 것을보고, 약간의 성공을 얻은 다음, 약간의 걸림돌 그들이 앞으로 나아갈 때 이 문제를 둘러싼 많은 문제가 있습니다 그래서 문제의 일부는 당신이 처음 시작, 당신은 어떤 데이터를 던져 모든 것이 작동합니다 하지만 그렇다면 당신은 – 음, 이제 갑자기 우리가 성장함에 따라 프라이버시 문제가 발생합니다

또는 규제 문제가 있습니다 그리고 이것들은 당신이 생각하지 않는 것들입니다 방금 알고리즘을 개발할 때 뭔가를 얻으려고 노력하면서, 그러나 그것은 회사의 성공에 결정적 일 수 있습니다 여기에는 또 다른 부류의 사람들이 있습니다 Launchpad를 통해 배운 놀라운 것들 중 하나입니다

예, 우리의 다음 고용을 위해 말한 회사와 이야기하고있었습니다 우리가 엔지니어보다는 변호사를 고용하고 있다고 생각합니다 그리고 그것은 내 경력에서 처음이었다 나는 그 감정에 실제로 동의했다 [웃음] 그래서 나는 당신에게 모든 이슈들을 말했습니다

그리고 지금까지 그것은 부정적이었습니다 터프 해 그러나 당신이 할 수있는 멋진 것들이 있습니다 그들은 단지 놀라운 것입니다 그리고 더 많은 것이 있습니다

그래서 나는 그들 중 일부를 통과 할 것입니다 나는 우리가 관여하고있는 몇 가지 계약을 선택했다 나는 너희 회사의 회사를 선택하지 않았다 그건 네 애들 중 어떤 애가 말하는 것과 같을거야 가장 좋아하는 영화

나는 그것을 할 수 없다 그래서 너희들을 내쫓 았어 스탠포드 대학에서 천체 물리학자를 만난 팀이 있습니다 그리고 그들은이 문제를 다루고 있습니다 중력 렌즈 작용 (gravitational lensing)

그럼 그게 무슨 뜻 이죠? 거기에는 은하계가 있습니다 그리고 은하계에서 지구로 빛이 비추고 있습니다 그리고 그들과 우리 사이에는 또 다른 은하가 있습니다 그리고 그 은하는 무겁습니다 그래서 실제로 빛을 굴절시킵니다

그리고 무슨 일이 일어나고 있는지 정확하게 측정 할 수 있다면, 본질적으로 그것은 퍼팅과 같을 것이다 중간 규모의이 은하 빛이 얼마나 무거워 지는지 확인하십시오 그리고 너는 뭔가를 배울 수있다 어둠의 물질과 그 멋진 것들에 대해서 이 사람들이 신경 쓰는 것 그리고 그것은 물리학 자들이 어떻게 여기에서 시작 하자고 말하면 계산이 가능합니다

물리학 법칙을 순방향으로 적용하십시오 그리고 그것은 우리에게 알려줄 것입니다 우리가이 은하가 어떤 것인지 알면, 그 빛이 어떻게 생겼는지 알려줄 것입니다 그리고 일치하지 않으면 이 하나를 약간 조정하고 다시 시도하십시오 그리고 슈퍼 컴퓨터에서 오랜 시간이 걸립니다

왜냐하면 그들은 많은 시련을해야하기 때문입니다 그리고이 사람들이 말한 것은 우리는 물리학 자입니다 우리는 수학을 이해합니다 우리는이 기계 학습에 관해서 아무것도 모릅니다 그러나 우리는 깊은 학습에서, 차별화되고 거꾸로 갈 수 있습니다

앞으로 나아갈 것보다 그리고 그것이 바로 우리가 필요로하는 것처럼 보입니다 그래서 몇 달 만에 그들은 스스로 가르쳤습니다 그들이해야 할 모든 것 그들은 그것을 시도했다

기존 기술보다 효과적입니다 그리고 1000 만 배 더 빠르게 달렸습니다 그래서 그것은 아주 멋진 성공입니다 그리고 그들은 2 개월 만에 성공을 거두었습니다 물론, 이들은 물리학 자입니다

그래서 평범한 사람, 당신이 단어 텐서를 말할 때, 그들은 조금 긴장 해 그러나 물리학 자들은 그것을 아침 식사로 먹습니다 어쩌면 조금 더 쉬울 수도 있습니다 그들은 문자 그대로 로켓 과학자입니다 여기 또 다른 예가 있습니다

비슷합니다 행성을 찾고 저는 Google에 오기 전에 NASA에있었습니다 그리고 저는이 사명의 전조에 관여했습니다 그래서 나는 그것을 정말로 좋아한다

그리고 그 생각은 먼 저 별을 바라 보는 것입니다 그리고 한 행성이 그 별을 동그라미 낀다 그리고 일식이 있습니다 따라서 일식은 빛을 조금씩 차단합니다 그리고 케플러 선교사는 그것을 찾았습니다

그리고 정말로 크고 큰 행성들은 먼 별 앞에서 지나쳐 차단해라 빛의 많은, 그들은 그것들 모두를 발견했다 그리고 그것은 차가웠다 그러나 이제 우리는 돌아가서 말하기를 원했고, 더 작은 행성을 찾을 수 있을까요? 기존 기술은 그렇게하지 않았습니다 많은 불확실성

그것은 단지 하나의 요소가 아닙니다 그러나 기계 학습 기술 그 (것)들을 뽑을 수 있었다 그리고 이제 우리는 더 많은 행성을 발견했습니다 이미 발견 된 것보다 그리고 나는 오늘 아침 또 다른 비슷한 종류가 있다는 것을 보았습니다 오래된 데이터를 보면서 표준 기술을 끌어낼 수있는 곳 쉬운 예제, 기계 학습으로 돌아 가기 더 많은 예제를 찾는 것입니다

우리는 의학 분야에서 많은 연구를 해왔습니다 이것은 망막을 보는 문제였습니다 및 안구 질환 진단 그리고 우리는 일반 의사보다 더 잘 할 수 있음을 보여주었습니다 그러나 우리는 그 외에 무엇을 할 수 있을까요? 우리는 고혈압을 감지 할 수 있을지도 모른다고 말했습니다

밝혀 지 네, 우리는 정말 잘 할 수 있습니다 그리고 엔지니어는 계속 가고있었습니다 그들은 굴러 다녔다 그리고 그들은 말했습니다 우리가 데이터베이스에 있니? 기둥 중 하나는 섹스입니다

우리가 그것을 예측할 수 있는지 봅시다 의사가 말하길, 오, 잠시만 요 남성과 여성의 망막에는 차이가 없습니다 당신은 그것을 예측할 수 없을 것입니다 엔지니어들이 말했습니다

왜 95 %의 정확도를 얻었습니까? [웃음] 그리고 의사들은 아직도 우리가 왜 그렇게 할 수 있는지 알지 못합니다 그들의 눈에 대한 이론은 불완전했다 그리고 의학 응용 프로그램은 모든 방법으로 이동합니다 고등학생까지 그래서 저는 로켓 과학자들에 대해 이야기했습니다

20 년간의 경험을 쌓았습니다 여기에없는 아이도 있습니다 20 년 동안 살아 있었지만 아직은 이것에 기여할 수있었습니다 그것은 단지 아픈 사람들 이상입니다 그래서 우리는 병든 식물을 볼 수 있습니다

그래서 너는 열대 우림으로 나간다 나뭇잎이나 무언가에 갈변을 감지 할 수 있습니다 그리고 숙련 된 농부라면 무엇을해야할지 알 것입니다 그러나 아마도 당신은 경험 많은 농부가 아니며, 아니면 기후 변화를 통해 다른 종류의 질병을 얻는다 전에는 보지 못했던 일들을 도와 줄 수 있습니다

진정한 도전 과제 중 하나는 여기에 있습니다 말하자면, 우리는 수퍼 컴퓨터를 꺼낼 수 없습니다 필드에 아마도 Wi-Fi 연결이 없을 것입니다 따라서 전화를 통해 로컬로 실행해야합니다

그래서 큰 도전 중 하나는 말하자면, 우리는 어떻게 이러한 연산이 많은 어플리케이션 전화기의 크기까지 확장 할 수 있습니다 여전히 작동하게 만드시겠습니까? 그리고 우리는이 경우 할 수있었습니다 다른 하나가 있습니다 그리고 모든 회사는 엘리베이터 피치를 가져야합니다 당신은 회사를 발명했습니다

그리고 회사가 뭐니? 그리고 답은 틴더와 비슷하지만 고양이에게는 그렇습니다 Conectera라고 불리는이 회사는 엘리베이터 피치가 있어요 Fitbit 같아요 그러나 암소를 위해서 그리고 그것은 어리석은 것처럼 보입니다

암소가 실제로 얼마나 많은 단계를 자랑해야하는지 오늘 했니? 아니, 그들은하지 않는다 그러나 농부는 실제로 무슨 일이 일어나고 있는지 알고 싶어합니다 농부가 알고 싶습니다 내 젖소가 아플까요? 그들 중 누구도 비정상적인 일을하고 있습니까? 얼마나 많은 양의 물을 마십니까? 얼마나 많이 걷고 있습니까? 그들은 여기에서 저기로 어디로 가나 요? GPS와 가속도계가있는 장치를 놓습니다 이제 전체 무리에 대한 전체 그림을 얻을 수 있습니다

Wi-Fi 연결이없는 또 다른 예가 있습니다 그래서 우리는 불법 삼림 벌채를 탐지하고 싶었습니다 그래서 당신이 생각할 수있는 주요한 것은 – 몇 가지 다른 일이 진행 중입니다 -하지만 중요한 건, 너 할 수 있니? 나무를 자르는 톱 소리가 들리는가? 그들이 큰 소리가 나면 파워 톱입니다 그러나 거기에는 아무도 없습니다

그래서 많은 센서를 현장에 투입합니다 센서는 기본적으로 여기에서 볼 수 있습니다 몇몇 태양 전지가있는 휴대 전화예요 시간이 지남에 따라 전원을 계속 유지해야합니다 그리고 나서 전화는 서로 메쉬 네트워크를 형성합니다

그리고 그들은 듣고 있습니다 그리고 우리는 무언가가 진행될 때 우리에게 알려줍니다 비디오 캡션 – 그래서, 한편으로는, 우리는 오랫동안 음성 인식을 해왔습니다 이것은 쉬워야합니다 그러나 다른 한편으로는, 자막 비디오 일반 음성 인식보다 조금 어렵습니다

마이크에 직접 대고 말하면 한 사람의 이야기가 있습니다 그건 꽤 쉬운 문제입니다 하지만 동영상이 있고 일어나는 일이 많고, 여러 사람이 말하는 한 번에, 자동차 충돌 등등, 나쁜 마이크 등등, 그것은 훨씬 더 어려워진다 그리고 백 가지 언어 – 그래서 우리는 그 문제를 해결하고 그것을 모두 자동화하려고했습니다 그리고 우리는 그 분야에서 성공을 거두었습니다

하드웨어와의 인터페이스 – 그래서 나는 내 휴대폰으로 많은 사진을 찍는다 나는 크고 무거운 DSLR로 많은 사진을 찍는다 그리고 크고 무거운 렌즈를 원하는 이유 중 하나는 그게 당신이 배경을 흐리게 수 있습니다 그러나 우리는 소프트웨어에서도 그렇게 할 수 있습니다 그리고 여기에서는 그것을 사용할 수있는 예제를 보았습니다

여기에 더 많은 예가 있습니다 우리는 Geena Davis Institute와 함께 일했습니다 그들은 영화 산업의 편향에 관심이 있습니다 그래서 우리는 얼마나 오래 화면에 누가 있는지 분석하고, 누가 말하기 역할을하는지, 그리고 나서 남성 대 여성간에 공정합니다 그리고 여기에서는 기본적으로 차트를 봅니다

그것은 여성이 선두 인 영화에서 말하는 것입니다 여성은 더 자주 나타납니다 많은 반면 남성이 선두 인 영화에서, 그것은 훨씬 더 비뚤어졌습니다 그래서 우리는 여기서 편견을 발견했습니다 그리고 그걸 구성 요소로 분해 할 수 있습니다

등등 그리고 더 많이 보아라 그리고 그것은 모두 자동으로 이루어졌습니다 이전에 그들은 매우 느린 진전을 보이고있는 반면 모든 프레임에 손쉽게 주석을 달아서 한 번에 모든 것을 할 수 있습니다 그래서 여기서 멈추고 질문을 위해 열어 보겠습니다

하지만 저는 그곳에 여기에 강력한 기회가 있습니다 당신이 할 수있는 많은 것들이 있습니다 그리고 우리는 진화를 계속하고있는 일련의 도구들을 가지고 있습니다 그리고 당신은 그 반쯤 만난다 너 내가 원한다고 말할 수 있어야 해

이 기술과이 방법론을 채택합니다 그리고 거기에 약간의 충돌이있을 것입니다 나는 많은 것을 발견하게 될 것이다 그건 나에게 새로운 것이지, 모두에게 새로운 것이있다 그러나 그것으로 우리는 많은 기회를 볼 수 있습니다

성공하고 일을하기 위해 너는 달리 할 수 ​​없었다 그렇다면 지금 질문에 대해 열지 않으시겠습니까? 네? 관객 : 가장 과대 평가되고 과소 평가 된 것은 무엇입니까? 현장에서 본 기계 학습의 응용 현재? 피터 노빅 : 글쎄, 후보자일지도 몰라 둘 다이 조수입니다 그래서 우리는 당신이 말하고 대화 할 수 있어야합니다 그리고 지금은 많은 사람들이 작은 연설자에게 중점을두고 있습니다

키보드가없는 탁자 위에 놓을 수 있습니다 화면이 없지만 당신의 말을들을 것입니다 그리고 이것들은 꽤 인기가있는 것으로 판명되었습니다 그리고 사람들은 그것들을 사고 말합니다, 아, 이거 정말 멋집니다 나는 음악을 연주하도록 요청할 수 있으며, 올바른 노래를 연주한다

그리고 날씨를 물어볼 수 있습니다 그리고 그것은 나에게 날씨를 알려준다 그리고 잠깐, 내가 물어볼 수있는 또 다른 것은 무엇입니까? [웃음] 따라서 그것이 할 수있는 일의 측면에서 큰 성공입니다 하지만 지금까지 실패한 점은 당신이 할 수있는 모든 것을 알아 냈습니다 반면에 다른 애플리케이션에서는 Google 검색에서 우리는 사용자에게 작품의 좋은 모델을 제시했습니다

그리고 작동하지 않는 것 기본적으로 몇 가지 키워드를 입력하면됩니다 해당 키워드와 관련된 페이지를 보여 드리겠습니다 사람들은 그 모델을 이해합니다 그리고 그들은 힘의 균형이 무엇인지를 안다

구글이이 금액을 할 것이라는 것입니다 그러나 사용자는 또한 정통한 사람을 데려 와야합니다 올바른 질문을하고 결과 페이지를 분석하는 것 이 비서들과 함께, 우리는 아직 거기에 있지 않습니다 그래서 우리는 그것이 사람과 같은 것이라고 말하는 것의 중간 정도입니다

당신은 사람과 이야기하는 방식으로 이야기합니다 그러나 우리는 또한 말하고 있습니다 글쎄, 실제로는 사람이 아닙니다 그것은 모든 것을 이해하지 못합니다 글쎄, 그때 그걸 어떻게 이해하니? 우리는 아직 명확하게하지 않았다

그리고 나는 시간이 지남에 따라 – 음, 하나, 능력이 확장됩니다 점점 더 많은 일을 할 수있게 될 것입니다 하지만 더 나은 사용자 인터페이스가 필요합니다 당신이 그것을 어떻게 생각해야하는지에 관해 말하는 것은 여기에서 그것이 할 수있는 일의 글쎄, 그건 자란 사람이 아니야

8 살이야 그것을 생각할 수있는 방법입니까? 아니, 그건 맞는 모델이 아니야 그래서 우리는 그것을 더 분명하게 할 어떤 방법이 필요합니다 고맙습니다 네? 청중 : 사람들이 해결하려고하는 문제가 있습니까? [알아들을 수 없는]? 피터 노르 비그 : 예, 문제가 있습니다

사람들이 기계 학습을 시도 할 것입니다 그리고 그들은 할 필요가 없다? 확실히 그럴 것입니다 그리고 유지하는 데 몇 가지 이점이 있습니다 가능한 한 간단합니다 따라서 중장비 기술을 사용하지 마십시오

쉬운 사람이 사용할 때 확실히 많은 예제가 있습니다 편익이 너무 작아서 편한 편이다 그것이 자동으로 아니더라도, 손으로 그것을 할 수 있습니다 그리고 아마도 손으로 그것을하는 비용이 있습니다

그러나 그것은 여전히 ​​큰 노력에 투자하는 것보다 쉽습니다 설명 형 문제도 있습니다 그래서 Google 검색을 할 때 알아 역사적으로 우리는 조금 저항했습니다 기계 학습에 너무 많은 통제권을 넘기는 것

그래서 우리는 항상 이런 생각을했습니다 검색에 관련되어 있으며 새로운 요소를 창출 할 것입니다 관심을 가져야하는 정보 또는 사용자가 상호 작용하는 방식 그들의 역사에있는 페이지와 함께 그것은 데이터입니다 우리는이 데이터를 사용하여 제품을 향상시킬 것입니다

그리고 우리는 종종 말을 잘하고, 우리가 알아 냈어 이제 이것을 추가 할 것입니다 얼마나 더 추가해야합니까? 음, 기계 학습 알고리즘 이러한 매개 변수의 올바른 값을 알아낼 것입니다 그러나 우리는 항상 말하기를 꺼려했습니다 모든 것을 하나의 깊은 학습으로합시다

네트워크 우리가 기계 번역에서 말하는 방식 그리고 나는 거기에 몇 가지 이유가 있다고 생각합니다 하나는 우리가 일종의 훈련을 만드는 것입니다 우리가 따라갈 때 데이터 그래서 자연스러운 데이터는 없습니다

이미지 처리를 원할 때, 세계에 자연의 그림이 있습니다 그러나 자연적인 예는 없다 우리가 만드는 검색 및 결과 이외의 검색 결과 그래서 우리가 그 데이터를 훈련한다면, 그리고 우리는 우리가하는 일을 바꿉니다 이제 데이터가 더 이상 유효하지 않습니다 우리를 걱정시키는 또 다른 문제는 우리가 몇 가지 단계를 앞두고 생각해야했던 것처럼 느껴졌다

왜냐하면 초기에 우리는 우리 직업이 웹 관찰하기 우리는 도서관 카탈로그와 같았습니다 다른 사람이 그 물건을 출판하고 우리는 단지 그것을 분류합니다 그 다음 우리는 우리가 실제로 그것과 상호 작용하고 있다는 것을 깨달았습니다 알고리즘을 변경할 때마다 웹 마스터는 우리가 한 일을 연구하고 그들이하는 일을 바꿀 수 있습니다

따라서 현재 데이터를 최적화 할 수는 없습니다 우리는 우리가 변화를 가졌다면 무슨 일이 일어날 지 말해야합니다 미래에 어떻게 될까? 그리고 그 알려지지 않은 미래에 대한 데이터는 없습니다 그래서 우리는 무슨 일이 일어나고 있는지 정말로 이해해야 만하는 것처럼 느꼈습니다 그리고 모든 것이 기계 학습 모델 일 뿐이라면, 미래가 어떻게 바뀔지 예측하는 것이 어려웠습니다

반면 몇 가지 기계로 손으로 작성한 코드라면 학습 된 매개 변수를 사용하면 더 쉽게 수행 할 수 있습니다 이것이 우리가 꺼려했던 한 가지 예입니다 그리고 이제는 시간이 지남에 따라 더 많은 기계 학습을 할 때, 우리는 더 많은 자신감을 갖게되고, 더 많이 몰래 움직이고 있습니다 검색 알고리즘으로 네? 관객 : [INAUDIBLE] 네, 그렇다면 데이터와 당신의 관계는 무엇입니까? 일반적으로? 그리고 그것은 어려운 질문입니다 대답이 하나도 없습니다

데이터를 어디에서 얻을 수 있는지 알아야합니까? 그것의 얼마를 필요로합니까? 그것이 어떻게 선별되거나 조작되어야합니까? 그리고 거기에는 여러 경로가 있습니다 그래서 때로는 데이터가 이미 거기에 있습니다 가서 찾아서 수집 할 수 있습니다 그리고 때로는 다른 사람들에게서 그것을 얻을 수 있습니다 때로는 그것을 만들어야합니다

그리고 많은 예제가 있습니다 초기 제품을 만들어 상호 작용을 얻으십시오 사용자와 그리고 나서 당신은 그런 종류의 부트 스트랩을합니다 그래서 우리는 예를 들어 음성 인식에서 그러한 작업을 수행했습니다 우리는 사람들의 예를 많이 갖고 싶었습니다

말하고 결과를 얻는 것 그래서 우리는 무료 서비스를 제공합니다 전화 번호에 대한 전화 번호 안내 그리고 사람들은 [비상업적 인] 사업을 요청할 것입니다 그리고 나서 우리는 답을 줄 것입니다

그리고 나서 우리는 말할 수 있습니다 우리는 올바른 답을 얻었는지 아닌지를 알아낼 수있었습니다 그들은 사업에 연결했기 때문에? 그래서 우리는 데이터 수집에 투자했습니다 그리고 많은 시간을 할애해야합니다 그렇다면이 질문은 무엇입니까? 익스텐트는 귀하의 특별 응용 프로그램입니다

다른 사람에게 일반적인 대 이제 Google 및 다른 회사를 볼 수 있습니다 이 사전 훈련 된 모델을 제공하고 있습니다 음성 인식이나 이미지 인식 또는 텍스트 작업 가공 등등 세상의 모든 것에 그리고 한 가지 접근 방법은 그것을 사용하는 것입니다

또 다른 한가지는 그것을 사용하는 것입니다 일부 데이터를 추가하여 수정하십시오 그리고 다른 접근 방법은, 아니요, 제 신청서는 그것은 그것을 사용하는 것이 전혀 도움이되지 않는다는 것이 었습니다 내 데이터로 처음부터 시작해야합니다 그리고 그 질문에 대한 답은 없습니다

너 스스로 조사해야 해 올바른 경로가 무엇인지 확인하십시오 곧 관객 : 그럼 해석 가능성 조각에, 기계 학습에 대해 어떻게 생각하십니까? 인간 지식의 진보와 관련이 있기 때문에? 망막보기 에서처럼 의사 마치 눈의 모형처럼 결과를 얻는다 개선되었지만 실제로는 그렇지 않습니다 그들은 실제로 그 지식을 가지고 있지 않습니다

그것에 대해 어떻게 생각하세요? 네 그래서 그것은 좋은 질문입니다 그래서 보자 그래서 이것은 당신에게 힌트를줍니다 그리고 저는 우리가 실험을하는 방법이 많이 있다고 생각합니다

데이터를 얻습니다 우리는 그것을 이해하지 못합니다 그리고 여러분은 돌아가서 새로운 이론을 만들어야합니다 그리고 저는 항상 그렇게 생각합니다 그리고 실험과 이론의 도약이 있습니다

그리고 지금은 기계가 달라질 수 있습니다 학습은 훨씬 더 강력한 도구를 제공합니다 실험을하기 어쩌면 과거에는 많은 영리한 인간이 있었을 것입니다 그리고 이론은 실험을 유도했을지도 모른다

보다 더 자주하지 그러나 많은 발견은 항상 있습니다 누군가가 말 했잖아, 웃긴다 나는 이론이 있다고 말하는 것보다 예기치 않은 결과가 있습니다 이제 설명 할 수 있을까요? 그래서 기계 학습은 그 호기심을 일으키는 데 도움이 될 것입니다

그것은 설명 자체를 도울 수 있습니까? 저는 이것이 우리에게 많은 개선이 필요한 부분이라고 생각합니다 그래서이 차트 중 일부를 보여주었습니다 데이터와 결정 경계의 공간을 볼 수 있습니다 등등 그리고 그것은 당신에게 약간의 아이디어를줍니다

그러나 더 나은 대화를 나누려면 더 나은 도구가 필요합니다 기계 학습 알고리즘 그것이 실제로하고있는 것을 이해합니다 그리고 다른 문제는 사람들이 혼란 스럽다는 것입니다 때때로이 이해력의 문제와 함께, 그들은 알고리즘을 비난한다 문제를 비난해야합니다

이해할 수있는 것들 간단한 용어로 설명 할 수있는 것들입니다 그래서 제가 수표 책의 균형을 잡고 싶다면, 나는 옳은 대답이 무엇인지 묘사하는 방법을 안다 그리고 나는 그것을하기위한 프로그램을 작성하는 방법을 안다 그리고 정확하게 정확하게하기 위해서는 복잡 할 수도 있습니다 하지만 본질적으로 그것은 간단한 문제입니다

그래서 그것을 해결하는 코드는 이해할 수 있어야합니다 프로그래밍 언어와 상관없이 또는 당신이 그것을 쓰는 데 사용하는 시스템 누군가의 얼굴을 알아보는 반면, 그것은 본질적으로 어려운 문제입니다 종종 정답이 정답이 아닐 수도 있습니다 여기 얼굴이 있습니다

그게 누구에게 속한거야? 전문가들은 옳은 대답에 동의하지 않을 수 있습니다 아무도 정답이 없습니다 그리고 둘째로, 그것을 발견하는 과정 의식이 없다, 말할 수있는 전문가가 없다 이것이 제가 그 결정을 한 방법입니다 오히려, 나는 그것을 어떻게했는지 모른다

내 잠재 의식의 정신은 내 의식의 마음보다 그것을했다 그래서 사람들은 기계 학습 알고리즘을 비난합니다 그 두 가지 문제를 해결하지 못했을 때 알고리즘의 잘못 사실이야 그 문제는 시작하기가 어려웠다

관객 : 안녕하세요 나는 아주 기본적인 질문을 가지고있다 기계 학습 문제를 어떻게 식별합니까? 특정 [부적절한] 문제가 있습니다 [INAUDIBLE]에는 여러 장소가 있습니다 기계 학습을 적용 할 수 있습니다

그래서 나는 아직도 실제 사용법을 찾는 방법을 알아 내고있다 기계 학습을위한 케이스 네 내 생각 엔 그게 경험이 될 것 같아 그래서 우리 제품 관리자가 사진 팀이 문제를 확인하지 못했습니다

그들은 그것이 가능하다는 것을 몰랐다 그들이 시도 할 수있는 그래서 당신은 어떤 비슷한 문제에 대해 최신 정보를 입수해야합니다 사람들이 작업 해 왔습니다 그래서 오늘 내가 너에게 보여주고 싶었던거야

다양한 가능성, 단지 여기에 대해 생각하게하려면 사물의 종류가 있습니다 할 수 있습니다 그래서 당신은 그 아이디어를 발휘할 필요가 있습니다 여기 다른 누군가가 한 일이 있습니다 이것은 내가하고있는 것과 비슷하게 보입니다

그리고 나서 당신은 그것을 분석 할 수 있어야합니다, 말하자면, 거기서 성공하려면 무엇이 필요합니까? 적절한 종류의 데이터가 필요합니다 올바른 종류의 객관적인 기능이 필요합니다 나는 사용자에게 그 유대 관계를 필요로하고 그들에게 유용 할 것이다 따라서 제품을 정의 할 수있는 단계를 파악합니다 그리고 더 자주 당신이 그것을할수록, 당신은 그것에 나아집니다

연설자 1 : 우리는 한 번 더 질문 할 시간이 있습니다 네 관객 : 실제로 얼마나 자주 실행 가능합니까? 모델을 유용하게 실행되는 것으로 축소 너무 복잡하다 대 휴대 전화에 컴퓨팅을 위해 클라우드로 이동할 필요가 있습니까? 피터 노르 비그 : 그래, 우리는 확실히 지출하고있어 더 많은 시간을 할애해야합니다 다행히도 많은 모델이 훨씬 쉽습니다

그들이 훈련하는 것보다 달릴 수있다 따라서 교육 과정은 복잡합니다 하지만 전화로 가져올 수 있다면, 나는 다양한 것들이 있다고 생각한다 그것들은 꽤 잘 덮여있다 폰은 정말 강력합니다

이제는 항상있을 필요가없는 한 지금 관객 : 예, 짧은 파열에있는 한 상호 작용의 피터 노르 비그 : 우리는 아직 그 지점까지 도달하지 못했습니다 하루 종일 휴대 전화에서 동영상을 실행할 수 있습니다 길고 모든 장면을 분석합니다

오래 전에 배터리가 소모됩니다 그러나 우리는 그 방향으로 일하고 있습니다 그래서 저는 여러분이 기본적으로 답을 말해야한다고 생각합니다 나는 그 일을 할 수 있습니다 그러면 문제는 어떻게 작동하게합니까? 그렇다면 모델을 컴파일하는 과정은 무엇입니까? 그리고 그것을 충분히 작게 만들어서, 너무 배고파하지 않게 만드시겠습니까? 얼마나 자주 모델을 업데이트해야합니까? 클라우드에서 다시 계산하고 다운로드하십시오

무엇을 다운로드합니까? 프라이버시 문제는 무엇입니까? 전화에서 실행되는 모델을 사용하면 당신이 지주의 책임으로부터 면제받을 수 있다는 것입니다 누군가의 개인 정보 전화가 켜져 있다면 그들의 문제가 아니라 당신의 문제 그리고 당신은 고소 당할 수 없습니다 해당 데이터를 복구 할 수는 없습니다

그러나 단점은 데이터를 수집하지 않는 경우입니다 당신은 개선 가능성을 이용하지 않습니다 그래서 많은 연구가 있습니다 지금 당신이 매개 변수를 공유 할 수있는 방법에 드러내지 않고 네트워크를 위해 밑에있는 데이터의 비밀 그리고 나는 그것들이 진짜 문제라고 생각합니다

언제 어디서 실행되는지에 대한 아키텍처 업데이트되고 데이터 흐름은 어떻게됩니까? 하지만 만약 내가 그 문제를 해결할 수 있습니다, 나는 그것을 전화로 실행할 수 있습니다 관객 : 차가워 요 고맙습니다 알겠습니다 네

고맙습니다 [박수 갈채] [음악 재생]

Machine Learning on Google Cloud Platform (Cloud Next ’18)

[음악 재생] 안녕, 여러분 모두들 안녕

관객 : 안녕하세요 크리스 클리브런 : 좋아요 제 이름은 크리스 클레 ​​반입니다 Justin Lawyer와 함께 우리는 제품 관리자입니다 Google 클라우드에서 우리는 당신과 대화 할 것입니다

GCP에서 기계 학습에 관한 정보 그래서 저는 매우 투명한 사람입니다 나는 그것을 무엇보다 명확하게 할 것입니다 나는 당신의 테이크 아웃이이 이야기에서 나온 것이기를 바랍니다 하나, 당신이 정말로 흥분하기를 바랍니다

기계 학습으로 할 수 있습니다 둘, 자신감을 갖기를 바래 조직에서 기계를 성공적으로 구현할 수 있는지 확인하십시오 Google Cloud로 학습하십시오 셋째, Google AI의 관심사를 통해이를 신뢰하십시오

우리는 당신의 ML을위한 올바른 플랫폼이자 파트너입니다 워크로드 세 번의 테이크 아웃 이요 우리는 당신이 그 테이크 아웃을 얻으려고 이야기 할 것입니다 우리가 그것을 파고 들기 전에, 나는 단지 당신에게 감사의 말을 전하고 싶다

우리 모두는 바쁜 삶을 사는 데 제한된 시간을 가지고 있습니다 Google Cloud, 다음 컨퍼런스, 이 세션 고마워 ML이 당신을 위해 무엇을 할 수 있습니까? 그것은 놀라운 것들을 많이 할 수 있습니다 조직에 경쟁이있는 경우, 그들이 ML을보고 있다고 보장합니다

자, ML은 반드시 정신병자를 발명하는 것이 아닙니다 교통 수단을 이용하는 경우 순간 이동을 어떻게 만들지가 아닙니다 기존 비즈니스 및 프로세스를 이용하는 것입니다 다시 상상하고 재발견 할 수있는 능력 너 오늘하고있는 일 ML에는 세 가지 종류의 큰 영역이 있습니다

통찰력을 얻는 데 도움이 될 수있는 도움이 될 수 있습니다 또는 고객이 제품 혁신에 도움을 줄 수 있습니다 자동화에 도움이됩니다 진짜 자동화를 빨리 봅시다 자가 운전 트럭과 자동차 – 모두가하는 사업 교통과 택시로 오늘하고있다

그것을 더 빠르고, 저렴하게, 더 쉽고, 더 안전하게 만들어줍니다 혁신을 살펴 보겠습니다 우리 고객 중 한 명이, 디즈니, 우리의 제품 AutoML을 사용하여 혁신 그들의 소매 서비스 사용자 경험을 원했습니다 그들이 찾고있는 제품을 정말 빨리 찾을 수 있습니다

그래서 그들은 웹 인터페이스를 사용하여 커스텀 모델을 만들었습니다 전문 지식이 필요하지 않습니다 그리고 지금 그들의 수색 경험에서, 당신은 "해변에 미키 마우스"를 입력 할 수 있습니다 해변과 관련된 모든 제품을 찾습니다 그리고 미키 마우스 – 정말로 멋지다, 정말로 쉽다

그리고 통찰력 – 당신이 비행기라고 가정 해 봅시다 제조사, 항공기, 그리고 당신은 정말로 안전에 관심이 있습니다 IoT 덕분에 엄청난 양의 데이터가 있습니다 이 악기들이하고있는 것 그리고 그 데이터를 수집한다면 어떻게 처리할까요? 그리고 아마 당신이 그걸 예측할 수 있다면 어떨까요? 비행기 정비 전에 필요한 정비 부품 정기적으로? 안전에 대한 통찰력, 그래서 무엇에 대해 흥분을 느끼는지 귀하의 조직이 할 수 있습니다

그래서 손을 보여줍니다 누가 여기에, 그들의 조직, 찾고 있습니다 오늘 기계 학습으로? 큰 손을 한 번 더 보여줍니다 여기 누가 기계 학습이 무엇인지 이해한다고 생각합니까? 네가 반 정도는 마지막 질문 – 누가 기계 학습 모델인지 알 수 있습니까? 네, 대부분

그래서 이것에 대해서 간단히 만질 것입니다 기계 학습은 데이터에 관한 것이며 데이터를 가져 오는 것입니다 통찰력과 행동 거기에는 모든 종류의 데이터가 있습니다 이미지, 구조화되지 않은 텍스트, 관계형 데이터베이스, 시퀀스 정보

그리고 기계 학습은 그 데이터를 취하는 것입니다 다양한 종류의 ML 알고리즘을 취하고, 그 알고리즘을 통해 그 데이터를 통과 거대한 인프라 세트가 필요합니다 그리고 그 데이터를 통과하면, 기계 학습 모델이 생성됩니다 그리고이 모델은 점점 좋아집니다 더 많은 데이터, 더 나은 알고리즘, 더 많은 인프라

그리고이 모델을 사용하여 통찰력, 자동화, 혁신 그래서 우리 모두는이 서비스, 웹 검색을 알고 있습니다 Google은 AI 회사이자 데이터 회사입니다 18 년 동안 세계 데이터 수집, 모든 사람이 접근 가능하고 사용 가능하게 만듭니다 우리는이 분야에서 많은 전문 지식을 보유하고 있습니다

대규모 데이터 센터, 인공 지능 전문가, 데이터 전문가 Google Cloud가 제공하는 전문 기술은 ML에 너에게 이것은 우리가 내부적으로 가지고있는 것에 대한 멋진 작은 이야기입니다 ML을 성공적으로 구현했습니다 Brein이라는 내부 AI 팀은 ML 모델을 만듭니다

알고리즘을 통해 수많은 데이터를 가져와 대규모 인프라 스트럭처를 통과시켜야합니다 ML 모델을 만들 수 있습니다 하지만 Google의 모든 소프트웨어 개발자는 아닙니다 ML 전문가입니다 우리가 한 일은 우리의 소프트웨어를 둘러 보았습니다

개발자를 교육하고 기존 모델로 ML을 구현하는 방법 그래서이 그래프가 보여주는 것은 소스 코드의 개수입니다 개발자가 Brain의 ML 모델을 사용하는 저장소 AI를 내부 서비스에 성공적으로 구현하기 위해, 외부 제품 Google은 이러한 유형의 개념을 Google Cloud에 도입합니다 오른쪽에는 여러 제품이 있습니다

ML과 AI를 통합했습니다 나는 그들 모두에 대해 이야기하지 않을 것이다 나는 두 가지에 대해서 이야기 할 것이다 내 즐겨 찾기 그래서 저는 아빠입니다, 저는 세 명의 아이들이 있습니다

그리고 저는 아이들의 디지털 사진을 많이 찍었습니다 어리석은 금액, 아마도 총 10 만개 그리고 저는이 Mac을 가지고 있었고 하드 드라이브가 몇 개 있었는데, 저장 용량이 걱정되어 Google 포토가 생겼습니다 무료 무제한 저장 글쎄, 잘됐다

값이 싸고 확장 가능하며 물건을 뒷받침하는 것에 대해 걱정해야합니다 그러나 실제로, 혁신은 검색 기능이었습니다 얼굴 인식 기능이 있으며 우리 애들이 누군지 알고 있습니다 내 얼굴 사진을 클릭 할 수 있습니다 내 전화에서 해변이나 보트 같은 단어를 입력하고, 이제 10 만 장의 사진을 찍습니다

내가 찾고있는 정확한 사진을 찾습니다 과거에는 20 분이 걸렸을 것입니다 ML은 혁신적이며 그렇게 할 수도 있습니다 조직의 규모에 관계없이 기술 직원 유형에는 ML을 구현하는 여러 가지 방법이 있습니다 그리고 우리는 두 가지 방법에 대해 이야기 할 것입니다

첫 번째 방법은 ML 모델을 사용하는 것입니다 ML 전문가가 될 필요는 없습니다 소프트웨어 개발자 일 필요가 있습니다 또는 귀하의 조직이 REST API를 사용하는 프로그래밍 언어 사용하기 쉽다

CXO 나 결정을 내리는 경영자라면, 프로젝트에 자금을 지원합니까? 높은 품질의 모델을 만드는 것은 매우 위험합니다 소프트웨어 개발자에게 API를 사용하게한다 그것을 구현하고, 정말로 빨리 시작하십시오 그리고 다른 길은 커스텀 모델을 만드는 것입니다 어쩌면 당신은 당신의 공간에서 도메인 전문가입니다

또는 데이터에 액세스 할 수 있고 원하는 자신 만의 ML 모델을 만들 수 있습니다 그래서 우리는 전문가들을위한 많은 도구들을 가지고 있습니다 빠르고 저렴한 ML 처리를 위해 그리고 여기가 저스틴에게 넘겨 줄 것입니다 그리고 그는 이것들에 대해 조금 이야기 할 것입니다

자세한 세부 사항 크리스틴 고마워 고마워, 크리스 그래서와 주셔서 대단히 감사합니다 오늘, 우리는 이야기 할 것입니다

당신의 직업에 맞는 도구를 어떻게 찾을 수 있습니까? 당신의 분야에서 전문가로서? 그래서 우선, 크리스가 언급 한 것처럼, Google은 많은 기계 학습 모델을 만들었습니다 특정 애플리케이션이 Google 애플리케이션을 강화할 수 있습니다 그래서 우리는 당신 주위에 REST API를 포장했습니다 소비하기 위해 우리는 이것을 지각 API라고 부릅니다

그들은 일반적으로 인간의 인식 주위에 있기 때문에 사용자가 애플리케이션과 상호 작용하는 방식 이렇게 빨리 다음 슬라이드로 이동하면, 이 API에는 크게 세 가지 범주가 있습니다 하나는 사이트에 관한 것이고 다른 하나는 대화에 관한 것입니다 세 번째 것은 언어에 관한 것입니다 아마 이들 각각을 걸을 것이 중요하다고 생각합니다 정말 신속하게 당신이 일종의 즉석에서 이해할 수 있습니다

코딩 없이도 얻을 수있는 기능 REST API를 사용하는 것 외에는 귀하의 응용 프로그램에 그래서 우선, 시력을 위해, 당신이 이미지를 가지고 있다고 말하면서, 그 이미지의 내용을 이해하고 싶습니다 자동으로 이미지를 Vision API에 전달하면 그 이미지 안에있는 물체가 무엇인지를 이해할 수 있습니다 자동으로, 그리고 당신은 얼굴이 어디 있는지 알아낼 수 있습니다, 다른 사람들에게 알릴 수 있습니다 동영상 이해 API의 경우 동영상, 장면 전환, 다른 대상을 알려줄 수 있습니다

해당 비디오 내에서 기본적으로 검색하고 찾을 수 있습니다 동영상 내 또는 동영상 전체에서 원하는 내용 여러 동영상을 전달하는 경우 OCR – 종종 사람들은 스캔 한 문서를 가지고 있습니다 그리고 무엇을 이해해야합니까? 도크는 그 문서에 있습니다 어쩌면 그것은 PDF 파일 일 수도 있고 GIF 파일 일 수도 있습니다

너는 할 수 있어야한다 GIF, JPEG가 아닙니다 API에 전달할 수 있습니다 그런 다음 자동으로 감지합니다 그 문서의 단어들은 무엇입니까? 그 원시 텍스트를 나중에 줄 수 있습니다

또는 장면의 이미지를 가지고 있거나, 벽에 징후가있다 그것은 당신에게 그 사인에 관한 텍스트를 줄 것입니다 따라서 OCR은 일상적인 응용 프로그램에서 정말 편리합니다 성인용 콘텐츠는 사실 실제로 하나입니다 정말로 중요합니다

사용자가 제출 한 콘텐츠를 얻으십시오 당신은 그 이미지에 무엇이 있는지 모릅니다 당신은 당신이 아닌지 확인해야합니다 사용자에게 부적절한 이미지를 제공합니다 따라서 성인용 콘텐츠 검색은 정말 쉬운 방법입니다

그 이미지에서 무슨 일이 일어나고 있는지 감지 할 수있게 당신이 걸러 내야 만하는 것이죠 귀하의 사용자에게? Conversation 클래스의 API의 경우 – 오디오를 텍스트로 – 스트리밍 오디오가있을 수 있습니다 그 다음 파일은 당신이 무엇을 말하고 있는지 알아 내야합니다 그런 다음 그 사건을 베끼고 그것을 당신에게줍니다 그것은 비디오, 사람들과의 실제 대화, 텔레비젼 쇼를 위해 무엇이든간에

그 반대도 가능합니다 텍스트 문자열이있을 수 있습니다 당신의 사용자에게 읽어 줄 필요가있다 자, 문자열을 응용 프로그램에 전달합니다 그러면 합성 음성을 만듭니다

그런 다음 사용자에게 알릴 수 있습니다 채팅 봇은 사용자와 소통 할 수있는 방법입니다 채팅에서 직접 원하는 상호 작용을 프로그래밍 할 수 있습니다 사용자와 대화하고 특정 종류의 대화를 프로그래밍 할 수 있습니다 계속해서 고객 서비스 전화로 도움을 받으십시오

또는 그런 것들 언어 API에서, 자유 형식의 텍스트를 가지고 있다면 정말 어렵습니다 정말 도대체 무슨 소리 야? 우리는 밖으로지도하고 무엇의 맥락을 알아낼 것입니다 말하자면, 문장의 데이터 구조를 찾아 내고, 당신이 알아낼 수 있도록 말의 부분을주세요 좋아, 명사 란 무엇인가? 동사는 무엇인가? 이것들의 관계는 무엇입니까? 그리고 나서, 당신은 지능적인 것을 할 수 있습니다

그 구조와 감정 분석은 함께 전송되는 분위기는 무엇인가요? 그 단어들로? 우리가 가진 것은 우리는 많은 좋은 성공을 시도했습니다

예를 들어 고객 서비스의 정서를 모니터하는 것 이메일이나 채팅, 물건 나가기 관리자에게 에스컬레이션 할 수 있음 그래서 물건들이 나선형으로 나오지 않도록 할 수 있습니다 제어 또는 무엇인가가 공격적인지 이해할 필요가 있다면, 또는 평온한, 또는 행복한, 당신은 어떻게 분류하고 있는지 확인합니까 고객이 평점을 매기는 것이 적절하다면 서비스 콜, 그런 것들? 번역에서는 자동으로 번역하는 좋은 방법입니다 한 언어에서 다른 언어로 예를 들어 다음에 대해 조금 이야기하겠습니다

예를 들어, 당신이 게임 개발자라고 말하면, 당신은 온라인 커뮤니티를 가지고 있습니다 하지만 그들은 전세계에서 온다 다른 언어로 말하기 당신은 그들이 서로 이야기 할 수 있기를 원합니다 실시간 채팅에서 기본적으로 할 수 있습니다

다른 언어로 번역 할 수있는 능력이 있어야합니다 따라서 Translate API를 사용하면 정말 쉽습니다 또는 인바운드 고객 서비스를받을 수 있습니다 이메일을 보내고 언어로 번역 할 수 있습니다 고객 서비스 담당자가 고객이 이해할 수 있도록 그러면 고객에게 응답 할 수있는 적절한 문서를 찾을 수 있습니다

이 API에 대한 좋은 점은 기본적으로 REST API 만 있으면됩니다 기본적으로 코드 스 니펫을 제공합니다 당신은 그것을 당신의 앱으로 팝니다 당신이 정말로 바꾸어야 할 유일한 것 데이터를 가리키는 키와 URI입니다 그리고 짜잔, 떨어져

그것보다 더 간단해질 수는 없습니다 다음 질문은 성능이 어떻습니까? 실제로 얼마나 효과가 있습니까? 그들은 일반적인 사용 사례에 정말 좋습니다 경우에 따라 문제가있을 수 있습니다 Google이 결코 다루지 않았던 또는 상황을 처리해야 할 수도 있습니다 Google이 다루어야 할 것보다 훨씬 더 자세하게 설명합니다

예를 들어 Google은 볼트와 못의 차이를 쉽게 알 수 있습니다 하지만 당신이 제조업 자라고 가정 해 봅시다 생산 라인에 2,000 개의 볼트가 있습니다 귀하의 부품에 대한 차이점을 어떻게 알 수 있습니까? 글쎄, 우리가 가능하게 한 것은 Cloud AutoML 그래서 당신은 라벨이 붙은 모든 부품의 이미지를 제공 할 수 있습니다 그리고 우리는 그들을 구별하지 못할 수도 있습니다

라벨을주지 않으면 그런 다음 모델을 교육합니다 그런 다음 REST API 엔드 포인트를 얻을 수 있습니다 귀하의 응용 프로그램에서 사용하십시오 그래서 좋은 점은 사용하기가 정말 쉽다는 것입니다

그리고 당신은 기계 학습을 알 필요가 없습니다 우리는 당신을 위해 그것을한다 그런 다음 응용 프로그램에서 사용할 수 있습니다 그래서 다음 질문은, 음, 이것이 얼마나 효과가 있습니까? 실제로 모든 오픈 소스보다 효과적입니다 밖에있는 모델

따라서 훌륭한 실적을 올릴 수 있습니다 그리고 사용하기가 정말 쉽습니다 그래서 정말 도움이되었습니다 그래서 실제로 ML을 사용하는 방법 중 하나입니다 또 다른 방법은 데이터 과학자가 있다고 가정 해 봅시다

내 자신의 데이터를 가지고 있기 때문에 내 모델을 만들고 싶습니다 그리고 그것은 내가 다룰 필요가있는 커스텀 문제입니다 음,이 작업에는 두 가지 다른 방법이 있습니다 하나는 클라우드 관리 서비스를 사용하고 있습니다 그리고 이것들은 당신이하지 않는 서비스입니다

인프라를 다루고 싶다 우리는 당신을 위해 그것을 다룰 것입니다 그렇게하면 컴퓨터 학습 프로세스에 집중할 수 있습니다 그래서 우리는 Dataproc과 Dataflow를 가지고 있습니다 그래서 당신은 당신의 전처리를 다룰 수 있습니다

Dataproc은 본질적으로 Hadoop 및 Spark이지만 관리, 또는 Dataflow가 백엔드에서 Beam을 사용하고 있습니다 프로세싱을 처리하는 관점에서 머신은, ML 엔진 또는 기계 학습 엔진, 인프라 스트럭처를 자동으로 가동시킬 수 있습니다 그리고 우리는 그걸 좀 알아볼 것입니다 당신이 끝나면 그것을 찢어 버려라 따라서 인프라 스트럭처가 사라집니다

데이터 과학자들로부터 모든 최상위 프레임 워크를 지원합니다 그리고 우리는 Datalab을 가지고 있습니다 데이터 탐색을 쉽게 할 수 있습니다 먼저 Datalab에 대해서, 얼마나 많은 사람들이 실제로 Jupyter Notebook을 사용했습니다 주피터 노트북에 대해 알고 있습니까? 약 3 분의 1 정도가 될 것입니다

나머지 사람들은 그렇게 이해합니다 주피터 노트는 근본적으로 데이터를 가리킬 수있는 앱 귀하의 데이터를 분석 할 수있는 코드를 제공하십시오

데이터를 시각화하고, 반환하고, 즉시보고, 얻을 수 있습니다 몇 가지 피드백을받은 다음 반복하여 반복하고, 그것을 계속 추가하십시오 전체 노트북을 재생할 수 있으며, 당신은 그저 특정 스 니펫을 연주 할 수 있습니다 직장 동료와 공유 할 수 있습니다 그래서 그것은 정말로 탐험하고 시각화하는 훌륭한 방법입니다

및 프로토 타입 그래서 환상적인 도구입니다 Datalab에 대한 좋은 점은 모든 다른 클라우드 서비스에 연결하도록 미리 구성 BigQuery와 ML 엔진 등이 있습니다 따라서 클라우드에서 벗어나기 만하면됩니다 랩톱에서 로컬로 사용할 수도 있습니다

기계 학습 엔진은 정말 좋은 방법입니다 임의의 데이터 사이트에서 분산 학습 수행 모든 상위 프레임 워크를 사용하여 데이터를 처리 할 수 ​​있습니다 그리고 다시, 그것은 관리 서비스입니다 따라서 모델과 데이터를 가리키고, 그리고 당신은 단지 그것을 회전시킵니다 그것은 당신을위한 모든 분산 훈련을 담당합니다

당신은 그것에 대해 걱정할 필요가 없으며 종료됩니다 모든 것을 찢어서 사용하는 것에 대해서만 비용을 지불합니다 그래서 이것을하는 것이 정말 효율적인 방법입니다 실수로 해당 VM을 켜두는 것에 대해 걱정할 필요가 없습니다 한달 전에 고지를 청구하고 청구서를받을 때

이것에 대한 또 다른 좋은 점은 배치 예측 및 온라인 예측도 수행합니다 기본적으로 이러한 일괄 예측 작업을 실행할 수 있습니다 정말 효율적입니다 또는 온라인 예측을 위해 REST API 끝점을 만듭니다 당신의 모델을 위해 당신을 위해 그리고 어떤 양으로도 봉사하십시오

당신은 당신이 가지고있는 많은 수의 앱을 필요로합니다 정말 쉬운 방법으로 앱을 관리 할 수있는 좋은 방법입니다 다른 하나는 데이터 과학자들이 종종 모델 최적화를하지 않는다 그것은 일종의 고통이기 때문에 모든 다른 매개 변수를 변경해야합니다

데이터 세트에 적합한 구성을 찾으십시오 글쎄, 우리는 그것을 ML 엔진에 내장했다 그래서 그것은 실제로 그것을 당신을 위해 간단하게 만듭니다 매개 변수 만 입력하면됩니다 최적의 모델을 찾으십시오

그래서 좋은 모델을 찾기보다는, 실제로 데이터 세트에 가장 적합한 것을 찾는 것입니다 따라서 모델 실적을 향상시킬 수 있습니다 관리 관점에서 모든 것을 하나로 모으는 것은, 우리는 전체 ML의 모든 단계에 대해 다른 서비스를 가지고 있습니다 애플리케이션에 대해 처리해야하는 라이프 사이클 우리는 섭취 측, 전처리 측, 저장 및 탐색 및 실험, 시각화 측면, 모델 교육 및 제공, Data Studio를 사용하여 보고서를 만들 수 있습니다

그것 모두는 우리의 관리 서비스에, 당신은 인프라를 다룰 필요가 없습니다 모든 호출기를 관리하는 SRE를 보유 할 필요는 없습니다 이렇게하는 다른 방법은 직접 해보는 것입니다 자신 만의 솔루션을 선보일 수 있습니다 사실 몇 가지 매우 유효한 이유가 있습니다

왜 일부 고객은 이것을 원할 것입니다 당신은 연구자 일 수도 있고 당신 일 수도 있습니다 스택의 모든 부분을 변경할 수 있기를 원한다 원한다면, 당신은 매우 맞춤화 된 파이프 라인을 가지고 있을지도 모릅니다 또는 당신이 최첨단을 원할 수 있습니다

오픈 소스 소프트웨어는 당신이 원하는 시점에 펑크 난다 여러 가지 이유가 있습니다 너는 그걸 원할지도 모른다 그게 전부입니다 우리는 그런 사용자를 좋아합니다

하이브리드 구현도 가능합니다 어떤 것들은 클라우드에 있고 어떤 것들은 온 – 프레미엄입니다 매우 일반적인 사용 사례입니다 우리는 그것을지지하고자합니다 그래서 직접 해보고 그것을 배포 할 방법이 있습니다

정말 중요합니다 따라서 우리와 똑같은 인프라 이전에 관리되고 있던 동일한 종류의 오픈 소스 플랫폼을 자동으로 롤백 할 수 있습니다 자신의 인프라에서 너는 그것을 관리한다 그리고 당신은 똑같은 하드웨어를 갖게됩니다

다른 솔루션에 전력을 공급합니다 그래서 우리는 얻는 것이 정말 쉽습니다 깊은 학습으로 시작되었습니다 깊은 학습은 정말 이륙하고 있습니다 복잡한 데이터에서 통찰력을 찾는 정말 좋은 방법입니다

세트 또한 인증 및 최적화 된 VM 이미지를 제공합니다 GCE에서 일하기 상자에서 꺼내면 Jupyter Notebook을 얻을 수 있습니다 모든 하드웨어에 액세스 할 수 있습니다

크리스가 잠시 후에 얘기 할 것입니다 그리고 가능한 최상의 결과를 얻을 수 있도록 구성되었습니다 따라서 클릭 한 번으로이 항목을 배포 할 수 있습니다 원하는 기계에 접근하여 접근하기 당신이 원하는 모든 액셀레이터에게 즉각적으로 갈 준비가되었습니다

우리는 약속에 대해 언급했다 Google이 오픈 소스 커뮤니티에 미친 영향 Kubeflow는 제가 좋아하는 오픈 소스 프로젝트입니다 지난 가을에 Kubernetes에서 시작되었습니다 특정 ML 작업을위한 마이크로 서비스를 만들 수 있어야한다

분산 형 교육 또는 분산 형 당신이 원하는 곳마다 다른 종류의 모델을 제공하고, 그것이 GCP에 있든 또는 온 – 프레스에 있든 상관 없습니다 따라서이 컨테이너를 배포하는 데 매우 휴대 가능한 방법입니다 당신이 원하는 곳이라면 그런 식으로 배포 할 수 있습니다 일관된 GCP 또는 온 – 리소스 일치에 대해 걱정할 필요가 없습니다

Kubernetes가 그것을 처리하기 때문에 이 모든 것을 다룰 수있는 쿠버 넷 고유의 방식입니다 그리고 다시 CPU, GPU 및 TPU에서 작동하도록 구성되었습니다 GCE에 온 – 프레미스 (On-prem), 내부적으로 가지고있는 모든 것에 액세스 할 수 있습니다 그렇다면 GCE에 배포하면 어떻게 될지 모르겠습니다

GKE 클러스터를 생성하고, 그것은 GCP의 관리 Kuvernnetes 클러스터입니다 그러면 JupyterHub 노트북을 스핀 업할 수 있습니다 TensorFlow 교육 서비스 또는 기타 프레임 워크를 시작하십시오 너는 넣고 싶었고 똑같은 일을했다 당신의 TensorFlow 서빙을 위해

모든 사용자가 공유 저장소에 액세스 할 수 있습니다 GCP에서 Kubernetes에게 자연스럽게 따라서 실제로 할 수있는 좋은 방법입니다 이것은 매우 휴대용 방식으로 그런 다음 전체 컨테이너를 원하는 위치에 배치 할 수 있습니다 그리고 그것은 환상적인 해결책입니다

그래서 지금, 나는 시간을 보낼 것입니다 Chris에게 하드웨어에 대해 이야기 할 것입니다 크리스 클리브 : 감사합니다, 저스틴 테이크 어웨이로 돌아가서, ML에 흥미를 느끼고, Google 클라우드에 ML을 구현할 수 있다고 확신하면서 Google의 인공 지능 (AI) 포커스는 우리를 귀하의 ML에 적합한 파트너로 만들어줍니다 워크로드

정말 빨리 이야기 해 봅시다 단지 이러한 것들을 되풀이하기 위해서입니다 개발자이고 ML을 구현하려는 경우, ML 전문가가 될 필요는 없습니다 API 모델을 사용하십시오 위험을 낮추십시오

사전 훈련 된 ML 모델이 마음에 들지 않는 경우 또는 사용자 정의 무언가를해야합니다 AutoML과 함께 웹 브라우저를 사용하여 사용자 정의 ML 모델을 작성하십시오 놀라운, 슈퍼 간단합니다 그리고 데이터 전문가 또는 기계 학습 과학자 인 경우, 또는 도메인 전문가가 작업 부하에 적합한 도구를 제공합니다 게다가

Google 클라우드에 ML을 성공적으로 구현할 수 있습니다 그러나 컴퓨팅 및 인프라에 대해 간단히 이야기 해 봅시다 ML과의 관계 최근 AI 개선 및 발전의 80 % 더 많은 이용 가능한 컴퓨팅 성능에 기인 한 것입니다 그러나 최근의 TensorFlow 이벤트에서, 설문 조사에 따르면 사람들이 접근 할 수 없다는 것을 인정합니다 ML 연구를 위해 충분히 계산할 수 있습니다

그것은 분명한 문제입니다 이제 수십 년 전으로 돌아 가자 왜냐하면 우리 모두 우리가 서있는 ML에서 일하는이 방에서 거인의 어깨에 신경망과 ML의 작동 방식에 대한 개념, 수십 년이 지났습니다 인간의 두뇌를보고, 어떻게 뉴런이 서로 연결되어 있는지, 그들이 정보를 전달하는 방법 한 뉴런에서 다른 뉴런으로, 그것은 오래된 개념입니다

하지만 최근의 구현입니다 대규모 데이터 센터 및 하드웨어 가속기 우리가이 큰 신경 네트워크를 만들 수있게 해줬습니다 ML의 발전 인프라가 중요합니다 그리고 그것이 중요한 이유는, 당신이 어떤 길로 가든 상관없이 – Google ML 모델을 사용하여 맞춤 모델 만들기 – 그것을 지탱하고있는 인프라입니다

우리 모델에서는 이미 데이터를 가져 왔습니다 훌륭한 알고리즘을 통과 시켰습니다 이 인프라, 대규모, 축구 규모의 현장 데이터 센터 이 모델들을 더 좋고 더 좋게 만드십시오 그리고 우리는 계속 그렇게 할 것입니다 Google Cloud를 사용하면 그 같은 규모로, 너와 그것을 할 수있는 것과 똑같은 힘 알맞게

GCP에 관한 새로운 ML 고객 중 한 명 OpenAI이고 대규모에 대해 이야기합니다 그들은 관리되지 않는 길로 갔다 그들은 도메인 전문가이고, 그들은 AI 사고 리더입니다 그들은 비영리 단체입니다 AI로 혁신하고 개방적이고 안전하게 만들기 위해 노력하고 있습니다

그들은 10 만개 이상의 프로세서를 사용합니다 보강 학습을 할 수 있습니다 수천 개의 GPU를 사용하여 기계 학습을하고 있습니다 혁신을 가능하게하는 것은 규모에 대한 접근입니다 그 (것)들을 위해 그것을 제공하고있는 Google Cloud입니다

하드웨어 가속기는 매우 중요합니다 하드웨어 혁신뿐입니다 CPU가 있으면 Skylake를 사용할 수 있습니다 그러나 ML 작업 부하의 경우 분산 된 교육의 경우 커다란 교육 일자리가 생기면 마비 된 계산 능력이 필요합니다 따라서 우리는 역사적으로 2017 년 2 월 이후로, 우리는 세 개의 NVIDIA GPU 모델 인 K80, P100, V100, 고성능, 패스 스루 PCI입니다

V100을 사용하면 NVLink 상호 연결이 가능하며, ML 워크로드에 아주 좋습니다 우리가 조금 다른 것보다 우리의 경쟁 업체는 맞춤 VM을 제공하는 방식을 사용합니다 CPU 사용량, 메모리 사용량, 기타 GPU 유형, 보유하고있는 GPU 수, 원하는 VM 수, 네트워크 연결 스토리지를 사용하거나 고속 디스크를 원할 경우 특정 작업 부하에 대한 I / O, 서버 내 SSD 연결, 그리고 당신이 원하는 것을 지불하십시오 또는 병목 현상이있는 경우 그 중 하나를 조정하십시오 우리의 다른 경쟁 업체 중 일부는 유연성을 제공하지 않습니다

그래서 돈을 저축하려고합니다 ML 작업이 더 빨리 진행될 것입니다 사실은 이번 주에는 새로운 P4 GPU를 출시했습니다 일주일 후에 나올거야 ML 추론 워크로드에 유용합니다

따라서 우리는 파트너 인 NVIDIA와 계속 협력 할 것입니다 새로운 GPU를 시작하십시오 그래서 우리는 거기서 멈추지 않습니다 AI에 초점을 맞추면 TPU가 생깁니다 우리는 Cloud v2 TPU를 작년에 만들었습니다

이것은 기계 학습을 위해 의도적으로 제작 된 ASIC입니다 그리고 오늘, 우리는 몇 가지 새로운 발표를했습니다 v3이 나오고, 빠르고 저렴한 ML 작업 부하 TPU 포드가 있습니다 TPU 포드는 일련의 TPU입니다

빠른 네트워크로 연결됩니다 다시 한번, 구글의 AI는 인프라를 구축하는 데 중점을두고 있습니다 우리는이 ML 모델을 더 빨리 교육하고 있습니다 우리는 또한 당신에게 그것을 제공하고 있습니다 우리는 당신의 ML을위한 올바른 파트너라고 믿어야합니다

워크로드 저축은 많은 돈입니다 많은 회사에 크고 큰 거래 스탠포드에 예산이있는 조교수가 있습니다 ML에서 몇 가지 연구를 수행합니다

그리고 그는 고정되어 있습니다 – 그가 할 수있는 일은 너무 많아 따라서 관리되지 않는 경로의 윈 – 윈 제품 – 선점 형 VM, 선점 형 GPU 및 TPU가 있습니다 때로는 여분의 용량이 있습니다 또한 교육 및 추론과 같은 ML 배치 워크로드, 우리는 GPU와 TPUs의 70 % 할인을 제공하고 오늘 아침에 발표했습니다 TPUs의 가격을 인하했습니다

그래서 지금,이 연구원은 우리의 여분의 수용력을 사용할 수 있습니다, 약간의 비용 절감, 배치 워크로드 실행 모든 사용 사례에 해당하는 것은 아닙니다 보장되지 않습니다 항상 거기있는 것은 아닙니다 하지만 연구를하고 있다면 필요한 일이나 큰 조직을해라 배치 작업 부하가 한 번씩 적은 비용으로 더 많은 혁신을 할 수있는 좋은 방법입니다

ML에서는 데이터가 정말로 중요합니다 Google은 훌륭한 광섬유 네트워크, 훌륭한 인터넷 서비스를 제공합니다 사이 따라서 데이터를 큰 단위로 이동하는 경우, 우리는 그것을 처리했습니다 실시간으로 들어오는 대규모 데이터 흐름이 다양한 출처 – 우리는 전 세계에 구름 위치를 가지고 있습니다

일부 데이터를 우리에게 발송해야하는 경우, 우리는 당신이 대량으로 출하 할 수있는 가전기구를 가지고 있습니다 그것은 단순한 계산이 아니라 훌륭한 인공 지능 서비스입니다 그것은 네트워크입니다 보안입니다 그것은 거기에 내장 된 모든 것입니다

그래서 우리는 많은 인공 지능 서비스에 대해 이야기했습니다 우리는 당신에게 개요와 소개를주었습니다 우리는 ML이 불가능 발명에 관한 것이 아니라는 것에 대해 이야기했습니다 그것은 재상영과 재발생에 관한 것입니다 너 오늘하고있는 일

현재 14,000 명이 넘는 고객이 GCP에서 ML을하고 있습니다 오픈과 하이브리드에 중점을두고, 및 멀티 클라우드 작업 부하, 하드웨어에 중점을 둠, 우리가 발표하는 우리의 새로운 서비스, 그리고 언급 한 기조 연설, 새로운 AutoML 서비스, 고품질 API – 네가 어떻게하고 싶은지 상관 없다 당신이 할 수 있다는 것에 흥분을 느껴야합니다 당신은 당신이 성공적으로 그것을 할 수 있다고 확신해야합니다 Google은 귀하에게 적합한 파트너입니다

더 배우고, 시작하고, 얻을 수있는 여러 가지 방법이 있습니다 세워짐 내가 특별히 말하고자하는 것은 내가 개인적으로 Kaggle이 사용되었습니다 Kaggle은 ML 대회 서비스 및 커뮤니티입니다 나는 ML을 배울 때, 내가 뭘하는지 몰랐다

그리고 이미지 인식 경쟁이있었습니다 운전자가 도로에주의를 기울이거나 또는 산만 한 느낌 그래서 커뮤니티에 가입하여 ML 도전에 합류했습니다 TensorFlow를 사용하는 방법에 대한 많은 리소스가있었습니다 및 데이터를 사전 처리하는 방법

그리고 Google은 Kaggle을 사용하여 전 세계 사람들을 돕고 있습니다 ML을 배우십시오 그리고 너도 그걸 쓸 수있어 또는 데이터 세트가 많은 조직의 경우, 당신은 경쟁을 시작할 수 있고 세계의 ML 전문가를 가질 수 있습니다 너를 위해 ML을해라

방법에 대한 자료가 많이 있습니다 이러한 서비스에 대해 알아보십시오 Google Cloud 고객이 아닌 경우 무료 크레딧이 제공됩니다 이미 그래서 그 점에 대해 감사 드리고 싶습니다

우리 시간은 거의 다됐다 우리는 몇 가지 질의 응답을 할 것입니다 양쪽에 2 개의 마이크 그리고 몇 가지 질문을하십시오 고마워요

[박수 갈채] [음악 재생]

Learning Scikit-Learn (AI Adventures)

YUFENG GUO : Scikit-learn은 오래되었습니다 점점 인기있는 도서관이되었다

기계 학습으로 시작되었습니다 그러나 아직 시도해 볼 기회가 없다면, 괜찮아 함께 확인해 봅시다 Cloud AI Adventures에 오신 것을 환영합니다 우리는 예술, 과학 및 기계 학습 도구를 탐구합니다

내 이름은 Yufeng Guo이고,이 에피소드에서, Kaggle 커널에서 scikit-learn을 사용하여 시작하는 것을 도와 드리겠습니다 가이드 할 수있는 리소스가 있음을 알려줍니다 당신의 학습은 앞으로 나아갑니다 문맥에 대한 역사의 작은 대시로 시작합시다 Scikit-learn은 원래 scikits

learn이라고 불 렸습니다 Google Summer of Code 프로젝트로 시작되었습니다 David Cournapeau Scikit 부분은 SciPy Toolkit이라는 이름에서 유래했습니다 그리고 거기에서, scikit-learn는 꾸준히 가지고 있습니다

입양 및 인기를 얻은 곳 오늘은 잘 기록되어 있고 잘 사랑 받았습니다 파이썬 기계 학습 라이브러리 scikit-learn을 살펴 본다면 scikit-learnorg에서 – 그리고 너는 분명히 – 버전 번호가 매우 낮다는 것을 빨리 알 수 있습니다 0

19를 기록했다 그걸 두려워하지 마라 도서관은 꽤 오래되었습니다 매우 잘 관리되고 신뢰할 수 있습니다 scikit-learn에 대해 정말로 깔끔한 것은 무엇입니까? 여러 가지 작업을 수행 할 수있는 풍부한 도구 모음 나는 기계 학습을 "주변"이라고 부르고 싶다

여기에는 데이터 집합로드의 모든 내용이 포함됩니다 전처리 조작 파이프 라인 및 메트릭 제 의견으로는, 정말 놀라운 부분입니다 scikit-learn에 관한 정보는 광대 한 컬렉션입니다 모두 포함 된 기계 학습 알고리즘 그리고 당신은 그것들을 시험해 볼 수 있습니다

최소한의 코드 조정만으로 그것은 정말 놀라운 방법입니다 다른 유형의 모델은 물론 직관력을 얻습니다 특정 모델에 대한 다양한 매개 변수 행하다 scikit-learn의 간단한 예를 살펴 보겠습니다 Kaggle 커널에서 작동합니다

우리는 여기 동물원 동물의 데이터 세트를 가지고 있습니다 단지 101 개의 다른 동물 분류 작업은 이 동물들이있는 7 개의 다른 클래스들 중 어느 것이 었습니다 팬더를 사용한 일반적인 접근 방식을 사용하여로드합니다 클래스 유형 필드는 마지막 열에 있으며, 그것이 우리가 예상하는 칼럼입니다

과거에는 데이터를 손으로 섞어서 나누었습니다 우리가 여기서 볼 수 있듯이 팬더를 사용합니다 이제는 scikit-learn이 통합되었으므로 실행하지 않겠습니다 이 모든 작업을 하나의 기능으로 그것들은 단지 너무 일반적으로 사용되기 때문에, train_test_split이라고합니다 교육 및 테스트 데이터 작성을 담당합니다

귀하의 기능과 라벨을 위해 이것들의 모양이 우리가 예상했던 것과 똑같은 것을 볼 수 있습니다 기본값은 데이터의 25 %를 사용하는 것입니다 나머지 75 %는 교육을받습니다 Support Vector Classifier 또는 SVC를 사용합니다

이 예제에서 하지만이 기계를 다른 기계로 쉽게 교체 할 수 있습니다 학습 알고리즘 다음으로, 우리는 그것에 적합하다고 부를 것이다 기차와 정말 같습니다

그런 다음 score를 호출하여 모델 성능을 평가합니다 마지막으로 몇 가지 예제를 시도하기 위해 예측을 호출합니다 보시다시피 scikit-learn에는 실제로 매핑되는 API가 있으며, 개념적 워크 플로와 정말로 비슷하게, 사용하기 쉽습니다 그래서 이것은 매우 단순하고 빠른 모양이었습니다

scikit-learn을 통합하는 방법 우리가 해왔 던 기존 작업 중 일부로 하지만 당신이 훨씬 더 많이 할 수 있다는 것을 압니다 자습서와 문서를 살펴보고, 멋진 모델을 만들 수 있습니다 다음에는 기계 학습의 다른 측면에 대해 이야기하겠습니다 scikit-learn으로 예측하기 그리고 그것을 확장하는 방법 클라우드 AI 모험 에피소드를 시청 해 주셔서 감사합니다

그리고 그것을 즐긴다면, 그것을 좋아하십시오 모든 최신 에피소드를 바로 구독하려면 구독하십시오 그들이 나올 때 그리고 기계 학습의 광대 한 세계를 탐험하는 것을 잊지 마십시오 scikit-learn이 제공해야하는 모델, 모두 간단하고 깨끗한 API를 사용합니다

Bringing AI and machine learning innovations to healthcare (Google I/O ’18)

[음악 재생] 릴리 펭 : 안녕 모두들 내 이름은 릴리 펭이야

나는 의사로서 훈련을하고 있으며 나는 Google 의학에 종사하고있다 잘, Google 인공 지능 건강 관리 팀 저는 제품 매니저입니다 그리고 오늘 우리는 몇 가지 프로젝트에 대해 이야기 할 것입니다 우리 그룹에서 우리가 해왔 던 그래서 처음에는, 당신이 많은 것을 얻을 것이라고 생각합니다

그래서 나는 이것을 너무 많이 지나치지 않을 것입니다 그러나 우리는 깊은 학습을 적용하기 때문에 의료 정보에, 나는 원하는 종류의 조금만 사용되는 몇 가지 용어를 정의하는 것 그러나 다소 불충분하게 정의됩니다 그래서 처음으로, 인공 지능 – 이것은 꽤 광범위한 용어이며 그 거대한 프로젝트를 포함합니다 비인간적 인 지능을 구축한다 기계 학습은 특별한 유형입니다 인공 지능에 대해서, 그것은 더 똑똑해질 수있는 기계를 가르치고 있습니다

그리고 깊은 학습은 특별한 유형입니다 너희들 기계 학습의 아마 꽤 많이 들었고 꽤 많이 들었습니다 우선 무엇보다 깊은 학습이란 무엇입니까? 그래서 인공 신경 네트워크의 현대 환생입니다 실제로 1960 년대에 발명되었습니다 그것은 조직 된 단순한 훈련 가능한 단위의 모음입니다 레이어에서

그리고 그들은 함께 작업하여 복잡한 작업을 해결하거나 모델링합니다 따라서 일반적으로 데이터 세트가 작고 계산이 제한적일 경우, 우리가 1980 년대와 90 년대에 가진 것입니다 일반적으로 다른 접근 방식이 효과적입니다 그러나 더 큰 데이터 세트 및 더 큰 모델 크기 더 많은 컴퓨팅 성능을 제공한다면, 우리는 신경 네트워크 훨씬 더 잘 작동합니다 실제로 두 가지 테이크 아웃이 있습니다

너희들이이 슬라이드에서 나가길 바란다 하나는 깊은 학습 열차 알고리즘입니다 충분한 데이터가 주어지면 매우 정확합니다 두 가지, 깊은 학습이 이것을 할 수 있습니다 기능 공학없이 그리고 그것은 명시 적으로 규칙을 쓰지 않고 의미합니다 그럼 그게 무슨 뜻이야? 글쎄, 전통적인 컴퓨터 비전에서, 우리는 규칙을 쓰는 데 많은 시간을 할애한다

특정 예측 작업을 수행하기 위해 기계가 따라야한다는 것을 의미합니다 길쌈 신경 네트워크 (convolutional neural networks) 우리는 실제로 기능에 거의 시간을 소비하지 않습니다 이러한 규칙을 작성하고 작성합니다 우리가 데이터 준비에 소비하는 대부분의 시간 수치 최적화 및 모델 아키텍처 그래서 나는이 질문을 꽤 많이 받는다

그리고 문제는 얼마나 많은 데이터가 충분한 데이터인지입니다 깊은 신경 네트워크? 일반적으로 더 많은 것이 좋습니다 그러나 특정 시점을 넘어선 수익이 감소하고 있습니다 일반적인 경험 법칙은 클래스 당 약 5,000 개의 긍정적 인 것을 좋아합니다 그러나 중요한 것은 좋은 관련 데이터입니다

쓰레기통에, 쓰레기통 이 모델은 예측하기 위해 무엇을 요구 하는지를 매우 잘 예측합니다 그래서 당신이 기계 학습을 어디에서 생각하는지, 특히 깊은 학습은 가장 큰 영향을 미칠 수 있습니다 실제로 장소에 있습니다 살펴볼 많은 데이터

우리 이사 중 한 명인 Greg Corrado가 최선을 다합니다 깊은 학습은 당신이 해낸 일에 정말 좋습니다 시간, 그리고 10,001 번째 시간에, 당신은 단지 그것의 아플 뿐이에요 더 이상하고 싶지 않아 그래서 이것은 검진에서 건강 관리에 정말 좋습니다

많은 환자를 볼 수있는 응용 프로그램 잠재적으로 정상입니다 전문 기술이 제한되어있는 곳에서도 좋습니다 오른쪽에 그래프가 나타납니다 세계 각국의 방사선과 의사 부족의 부족 그리고 이것은 다른 의학 전문 분야에도 해당됩니다

그러나 방사선과 의사가 여기 있습니다 그리고 우리는 근본적으로 의료 전문 지식의 세계적 부족을 봅니다 그래서 심사 신청 중 하나 우리 그룹이 당뇨병 성 망막증을 앓고 있습니다 더 쉽기 때문에 우리는 이것을 DR이라 부릅니다 당뇨병 성 망막증보다

그리고 예방 가능한 실명의 가장 빠른 성장 원인입니다 당뇨병 환자는 모두 4 억 5 천만 명에 달합니다 1 년에 한 번 상영됩니다 이것은 뒤의 사진을 찍음으로써 이루어진다 특별한 카메라로 눈의 모습을 볼 수 있습니다

그리고 그림은 그 것처럼 조금 생겼습니다 의사가 이런 이미지를 얻을 때 의사가하는 일 질병없이 1에서 5 단계로 등급을 매기 는가, 건강하고, 질병을 번식시키고, 그것은 마지막 단계입니다 그리고 그들이 등급을 매길 때, 때로는 매우 미묘하게 보입니다 결과, 미세 동맥류라고하는 작은 것들 그것은 눈의 혈관에 outpouchings입니다 그리고 그것은 당뇨병이 얼마나 안 좋은지를 나타냅니다

당신의 비전에 영향을 미치고 있습니다 그래서 불행히도 세계의 많은 지역에서, 이 일을하기에 안과 의사가 충분하지 않습니다 그래서 인도에있는 한 파트너와 함께, 또는 실제로 인도에있는 우리의 파트너 몇, 전국에 127,000 명의 안과 의사가 부족합니다 결과적으로 환자의 약 45 % 질병이 감지되기 ​​전에 시력 손실의 일종을 겪는다 네가 회상 한대로이 질병이 완전히 예방할 수있었습니다

다시 한번 이것은 일어나서는 안되는 것입니다 그래서 우리가하기로 결심 한 것은 우리가 파트너가 된 것입니다 인도에 몇 군데 병원을두고, 미국의 선별 서비스 제공 업체입니다 그리고 우리는이 첫 번째 시도에 대해 약 130,000 개의 이미지를 얻었습니다 우리는 54 명의 안과 의사를 고용하고 라벨링 도구를 만들었습니다

그리고 54 명의 안과 전문의는 실제로 이 스케일에서이 이미지의 등급을 매겼는데, DR에서 증식으로 흥미로운 점은 실제로 의사가 이미지를 호출하는 방법에 약간의 변동성이 있습니다 그래서 우리는 실제로 약 880,000 건의 진단을 받았습니다 이 레이블이 지정된 데이터 세트를 사용하여 알려진 콘볼 루션 신경망 이것은 시작이라고합니다

나는 너희들 중 많은 사람들이 그것에 익숙하다고 생각한다 일반적으로 사진 앱을 위해 고양이와 개를 분류하는 데 사용됩니다 또는 다른 검색 애플 리케이션을 위해 그리고 우리는 그저 안저 영상을 재사용했습니다 그래서 우리가 배운 다른 것 우리가이 일을하는 동안 그게 정말 유용했던 동안 이 5 점 진단, 그것은 또한 믿을 수 없을만큼 의사에게 유용하다

이미지 품질과 같은 하우스 키핑 예측에 대한 피드백, 이것이 왼쪽 눈인지 오른쪽 눈인지, 또는 이것이 망막의 어느 부분인지 알 수 있습니다 그래서 우리는 그것을 네트워크에도 추가했습니다 그럼 얼마나 잘하는거야? 이것이 우리 모델의 첫 번째 버전입니다 우리가 2016 년 의학 저널에 발표 한 내용은 제가 믿습니다 여기 왼쪽에는 차트가 있습니다

총계에있는 모형의 성과의 약 10,000 개 이상의 이미지 민감도는 y 축에 있고, 1 마이너스 특이성 x 축에있다 감도는 시간의 백분율입니다 환자가 질병에 걸렸다면 그 모델이 그 질병을 부르고 있었을 때, 맞았습니다 그리고 특이성은 비율입니다

모델에 질병이없는 환자들 또는 의사가 옳았다 그리고 당신은 뭔가를 원한다는 것을 알 수 있습니다 높은 민감도와 높은 특이성을 지니고 있습니다 그리고 위아래로 – 또는 위로 그리고 왼쪽으로 좋다 그리고 차트에서 여기를 볼 수 있습니다

작은 점들이 그 의사들이라고 동일한 세트를 채점하고있었습니다 그래서 우리는 의사와 매우 가까워졌습니다 그리고 이들은 보드 인증을받은 미국의 의사들입니다 그리고 이들은 안과 의사, 일반 안과 의사들입니다 훈련으로

사실 F 점수를 보면 감도와 특이성의 결합 된 척도이며, 우리는 중앙 안과 전문의보다 조금 나아졌습니다 이 특별한 연구에서 그래서 그 이후로 우리는 모델을 향상 시켰습니다 그래서 작년에 약 2016 년 12 월 우리는 일종의 동위에 있었다 일반인들과

그리고 올해는 – 이것은 우리가 발행 한 새로운 논문입니다 우리는 실제로 망막 전문가를 사용했습니다 이미지를 채점하기 위해 그래서 그들은 전문가입니다 우리는 또한 그들이 동의하지 않을 때 논쟁하도록했습니다

진단이 뭔지에 대해서 그리고 우리는 모델을 언제 사용 하는지를 볼 수 있습니다 그 사실을 근거로 모델은 매우 잘 예측했습니다 게다가 올해 우리는 일종의 동위에 있습니다

망막 전문가와 그리고이 가중 카파는 단지 5 수준의 합의 그리고 본질적으로 우리는 안과 의사와 망막 사이의 일종 사실 전문가들 사이에 망막 전문가 우리가 작업 해 왔던 또 다른 일 모델을 개선하는 것을 넘어서 실제로는 네트워크를 설명하려고 애쓰다 그것이 어떻게 예측을하고 있는지 다시 한번, 연극이나 연극을 가져 가라

소비자 세계의 플레이 북에서, 우리는 show me where라는 기술을 사용하기 시작했습니다 그리고 이것은 이미지를 사용하는 곳입니다 실제로 열 화상지도를 생성합니다 관련 픽셀은이 특정 예측을위한 것입니다 그래서 여기 포메라니스트의 그림을 볼 수 있습니다

그리고 히트 맵은 거기에 당신을 보여줍니다 포메 라니아 사람의 얼굴에있는 무언가이다 그것은 Pomeranian-y를 보게합니다 그리고 여기 오른쪽에는 아프간 인의 사냥개가 있습니다 그리고 네트워크는 아프간 인 사냥개를 강조했다

그래서 이와 비슷한 기술을 사용하여, 우리는이를 안저 이미지에 적용했다 우리가 말했지, 어디 있는지 보여줘 이것은 가벼운 질병의 경우입니다 그리고 나는 가벼운 질병이라고 말할 수 있습니다 왜냐하면 – 잘, 그것은 나에게 완전하게 정상적으로 보인다

나는 거기에 어떤 질병이 있다고 말할 수 없다 하지만 고도로 숙련 된 의사라면 미세 동맥류 라 불리는 작은 것을 골라 낼 수있다 녹색 지점이있는 곳 다음은 중등도의 질병 사진입니다 그리고 이것은 당신이 볼 수 있기 때문에 조금 더 나쁩니다

여기 끝에 약간의 출혈 그리고 실제로 나는 신호 할 수 있는지, 하지만 거기에 피가 나옵니다 그리고 열지도 – 히트 맵이 있습니다 출혈을 일으킨다는 것을 알 수 있습니다 그러나이 이미지에는 두 가지 유물이 있습니다

그래서 작은 얼룩처럼 먼지가 있습니다 그리고이 작은 반사가 있습니다 이미지의 중간에 그리고 당신은 그 모델이 근본적으로 그것을 무시합니다 그럼 다음은 뭐니? 우리는 모델을 훈련 시켰습니다

우리는 다소 설명 할 수 있음을 보여주었습니다 우리는 그것이 올바른 일을한다고 생각합니다 무엇 향후 계획? 음, 우리는 실제로 의료 시스템에 이것을 배치해야합니다 우리는 의료 공급자와 제휴하고 있습니다 그리고 회사는이를 환자에게 제공해야합니다

실제로 제게 메가 박사님, 누가 저를 대담하게 말할 것입니까? 이 노력에 대해 좀 더 자세히 설명 할 것입니다 그곳에 그래서 심사 신청서를 제출했습니다 그리고 여기 진단의 응용이 있습니다 우리가 작업하고있는 그래서이 특별한 예에서 우리는 질병에 대해 이야기하고 있습니다

우리는 유방암에 대해 이야기하고 있습니다 그러나 우리는 유방암의 전이에 대해 이야기하고 있습니다 근처 림프절로 따라서 환자가 유방암 진단을 받았을 때 원발성 유방암이 제거되면, 외과의 사는 밖으로 약간 시간을 보낸다 우리가 림프절이라고 부르는 것을 조사 할 수 있도록 유방암이 전이되었는지 아닌지보기 그 노드들에게 그리고 그것은 환자를 어떻게 대하는가에 영향을 미칩니다

이 림프절을 읽는 것은 쉬운 일이 아닙니다 그리고 실제로 그들이 돌아올 때의 생체 검사의 약 24 % 그들을보기 위해, 24 %는 마디 상태의 변화를 가지고 있었다 이는 긍정적 인 경우 부정적인 것으로 읽음을 의미합니다 그리고 그것은 음성적이었고, 긍정적이었습니다 그래서 그것은 정말로 큰 문제입니다

4 분의 1에요 흥미로운 점은 다른 연구 결과에 따르면 무한한 시간을 가진 병리학 자, 실제로 데이터에 압도 당하지 않았다 매우 민감하기 때문에 94 %의 감수성 종양 환자에게 시간 제약을 가하면, 그들의 감수성 – 또는 미안, 공급자에, 병리학 자에게는 감도가 떨어집니다 그리고 사람들은 내려다보기 시작할 것입니다

거의 전이가 없을 수도 있습니다 그래서이 그림에 바로 거기에 작은 전이가 있습니다 그리고 그것은 보통 놓친이 작은 것들입니다 많은 정보가 주어지면 놀랍지도 않습니다 각 슬라이드에 있습니다

따라서 이러한 슬라이드 중 하나가 디지털화 된 경우, 약 10 기가 픽셀입니다 그리고 그것은 말 그대로 건초 더미에있는 바늘입니다 흥미로운 점은 병리학 자들이 실제로 그들이 자신의 모든 시간을 보면서 암의 73 %를 찾는다 슬라이드마다 오진 (false positive)이 발생합니다 그래서 우리는이 작업을 도울 수있는 모델을 교육했습니다

실제로 암 병변의 약 95 %를 찾습니다 슬라이드 당 8 개의 가양 성이 있습니다 그래서 이상적인 시스템은 분명히 하나입니다 모델을 사용하여 매우 민감하지만 매우 구체적입니다 병리학자를 실제로 훑어 보는 것에 의존하는 거짓 긍정 (false positive)과 오탐 (false positive)이라고합니다 그래서 이것은 매우 유망하며 우리는 지금 클리닉에서 유효성 검사를하고 있습니다

독자 연구의 관점에서, 이것이 실제로 어떻게 의사와 상호 작용하는 것은 정말로 중요합니다 그리고 분명히 다른 조직에 응용할 수 있습니다 나는 림프절에 관해 이야기했지만 초기 연구가있었습니다 실제로 이것은 전립선 암에서 효과가 있음을 보여줍니다 글리슨 그레이딩에 대해서도 마찬가지입니다 그래서 이전 예제에서 우리는 말했습니다

얼마나 깊이있는 학습이 매우 정확합니다 그리고 그들은 의사가 이미 만들었던 전화를하는 경향이 있습니다 그러나 의사가 현재하지 않는 것들을 예측하는 것은 어떨까요? 이미징에서 할거야? 그래서 당신이 이야기의 처음부터 기억하고 있듯이, 깊은 학습에 대한 위대한 것들 중 하나 매우 정확한 알고리즘을 훈련시킬 수 있다는 것입니다 명시 적으로 규칙을 작성하지 않아도됩니다 그래서 우리는 완전히 새로운 발견을 할 수 있습니다

그래서 왼쪽 그림은 종이에서 나온 그림입니다 우리가 최근에 출판 한 다양성을 예측하는 훈련 된 심층 학습 모델 의 심혈관 위험 요인 여기에는 나이, 자기보고 섹스, 흡연 상태, 혈압, 일반적으로 의사들 환자의 심장 혈관 위험을 평가하기 위해 지금 고려해보십시오 적절한 치료 권고를하십시오 그래서 우리는 우리가 이러한 요소 중 많은 것을 예측하고, 매우 정확하게, 실제로 5 년 위험을 직접 예측할 수 있습니다

심장 사건의 그래서이 연구는 아주 일찍, 정말 폐활 적이었고, 이 예측을위한 AUC는 07이다 이 숫자가 의미하는 것은 두 장의 그림이 주어지면 심혈관 사건이없는 환자의 사진 그리고 한 환자의 사진은 약 70 % 그 시간의 대부분의 의사들은 약 50 %의 시간을 보냈고, 그것은 무작위 적이기 때문에 – 마치 혼자 망막 이미지를 기반으로하기가 어렵습니다 그렇다면 왜 이것이 흥미로운가? 일반적으로 의사가 시도 할 때 심혈관 질환 위험을 평가하기 위해, 관련된 바늘이 있습니다

그래서 나는 누군가가 혈중 콜레스테롤을 섭취했는지 모른다 상영 전에 밤에 금식하고 혈액 샘플을 가져가 그런 다음 위험을 평가합니다 다시 한번, 저는 이것이 정말로 초기에 있다는 것을 강조하고 싶습니다

그러나 이러한 결과는 아이디어를 뒷받침합니다 우리가 뭔가를 사용할 수 있을지도 몰라 우리가 할 수 없었던 새로운 예측을하기 위해 이미지처럼 전에 만들어라 그리고 이것은 정렬로 수행 될 수 있습니다 비 침습적 인 방식으로

그래서 몇 가지 예를 들어 보았습니다 세 가지 예가 있습니다 얼마나 깊은 학습이 실제로 두 가지 가용성을 증가시킬 수 있는지 건강 관리의 정확성 그리고 내가 원하는 종류의 것들 중 하나 이것이 여기에있는 이유가 여기에 있음을 인정하십시오 TensorFlow는 점점 더 흥미 진진합니다

오픈 소스입니다 일반적인 기계 학습에서 이런 종류의 개방형 표준 어디서나 적용되고 있습니다 그래서 저는 Google에서 한 일의 예를 들었습니다 커뮤니티 전체에서 수행되는 많은 작업이 있습니다 매우 유사한 다른 의료 센터에서

그래서 우리는 무엇에 대해 정말 흥분하고 있습니다 이 기술은 건강 관리 분야에 도움이 될 수 있습니다 그리고 그걸로 Jess Mega를 소개하고 싶습니다 저와 달리, 그녀는 진짜 의사입니다 그리고 그녀는 Verily의 최고 의료 책임자입니다

제시카 메가 : 여기에와 주셔서 감사합니다 그리고 우리를 걷어차 기 위해 릴리에게 감사드립니다 나는 AI와 건강 관리에 대한 흥분을 생각한다 더 커질 수는 없다 들으 셨던 것처럼, 제 이름은 메스 제스입니다

나는 심장 전문의이고, 너무 기쁘다 알파벳 가족의 일부입니다 Verily는 Google과 Google X에서 성장했습니다 그리고 우리는 전적으로 의료 및 생명 과학에 중점을두고 있습니다 우리의 사명은 세계의 건강 정보를 취하는 것입니다

환자가보다 건강한 삶을 누릴 수 있도록 유용하게 만듭니다 그리고 오늘 제가 이야기 할 예제는 당뇨병에 초점을 맞추고 있습니다 릴리가 시작한 대화에 정말로 도움이됩니다 하지만 일시 중지하는 것이 매우 중요하다고 생각합니다 건강 데이터를 광범위하게 생각해보십시오

현재 청중에있는 모든 개인 약 몇 기가 바이트의 건강 데이터가 있습니다 그러나 수년 동안 건강에 관해 생각한다면 유전체학에 관해서 생각해보고, 분자 기술, 이미징, 센서 데이터, 환자보고 데이터, 전자 건강 기록 우리는 엄청난 액수에 대해 이야기하고 있습니다 데이터, 기가 바이트의 데이터 그리고 Verily와 Alphabet에서 우리는 우리가 환자들을 도울 수 있도록이 일에 앞장설 것입니다 우리가 초기에 우리의 노력 중 일부를 집중하고있는 이유 당뇨병에 이것은 긴급한 건강 문제입니다

약 10 명 중 1 명이 당뇨병을 앓고 있습니다 당뇨병에 걸릴 때 시체에서 설탕 포도당을 어떻게 다룰 지 그리고 당신이 prediabetes에 대해서 생각한다면, 누군가 당뇨병에 걸리기 전에 조건, 3 명 중 1 명입니다 오늘 청중의 전체 중앙 섹션이 될 것입니다 이제 몸이 처리 할 때 어떤 일이 발생합니까? 포도당은 다른 방법으로, 당신은 다운 스트림 효과를 가질 수 있습니다

릴리가 당뇨병 성 망막증에 대해 이야기하는 것을 들었습니까? 사람들은 심장, 신장, 말초 신경 병증 이것이 우리가 앞서 나아갈 필요가있는 질병의 유형입니다 그러나 우리는 우리가 다루려고하는 두 가지 주요 쟁점을 가지고 있습니다 첫 번째는 정보 격차입니다 따라서 당뇨병 환자 중 가장 견고한 환자들조차도 – 우리 할아버지는이 중 하나 였어

하루에 네 번씩 혈당을 확인합니다 오늘이 누구인지 모르겠다 어떤 간식을 먹을 수 있습니다 나는 캐러멜 팝콘을 실제로 가지고 있었다 누구든지 그 중 하나가 있었나요? 그래, 대단하다

우리의 생물학과 우리의 포도당은 위아래로 가고 있습니다 그래서 제가 그 순간에 포도당을 검사하지 않으면, 우리는 그 데이터를 포착하지 못했을 것입니다 그래서 우리는 생물학이 항상 일어나고 있다는 것을 압니다 심장병 전문의로 병원에있는 환자를 볼 때, 나는 누군가의 심장 박동수, 혈압, 모든 것을 볼 수있다 이 생체 신호 중 실시간으로 그리고 사람들은 집으로 돌아가지만 생물학은 여전히 ​​일어나고 있습니다

따라서 정보 격차가 있습니다 특히 당뇨병 환자와의 차이 두 번째 쟁점은 의사 결정 갭입니다 1 년에 1 회, 1 년에 2 회, 그러나 매일 건강에 대한 결정이 내려지고 있습니다 그들은 매주, 매일, 매시간 일어나고 있습니다

그리고 우리는 어떻게이 격차를 좁히기로 결정합니까? 진실로 우리는 세 가지 핵심 사명에 집중하고 있습니다 그리고 이것은 거의 모든 프로젝트에 적용될 수 있습니다 우리는 교대하는 법을 생각하고 있습니다 에피소드 및 반응 치료에서 훨씬 예방적인 치료에 이르기까지 다양합니다 그리고 그 일을하고 요점을 이해하기 위해 우리는 실제로 AI의 힘을 사용할 수 있습니다

우리는 세 가지를해야합니다 올바른 데이터를 수집하는 것에 대해 생각해야합니다 그리고 오늘 저는 지속적인 포도당 모니터링에 대해 이야기 할 것입니다 그런 다음이 데이터를 어떻게 구성하여 형식으로되어 있는지 확인하십시오 우리는 환자의 잠금을 해제하고 활성화하여 진정으로 도움을 줄 수 있습니까? 그래서 우리가 당뇨병 분야에서 이것을 행하는 지 여부 오늘 또는 우리의 수술 로봇에 대해 듣게 될 것입니다

이것은 일반적인 전제입니다 생각할 첫 번째 사항은 데이터 수집입니다 그리고 릴리가 쓰레기를 말하면서, 쓰레기가 나옵니다 이해하지 못하면 통찰력을 찾을 수 없습니다 우리가보고있는 것

그리고 절대적으로 혁명적 인 한 가지 매우 작은 생체 적합성에 대해 생각하고있다 전자 제품 따라서 우리는 차세대 감지 기술을 연구하고 있습니다 그리고 여기에서 데모를 볼 수 있습니다 이것이 예를 들어, 매우 작은 연속 포도당 모니터가있는 곳에서 이러한 도구 중 일부를 만들기 위해 협력하고, 이것은보다 매끄러운 통합으로 이어질 것입니다

다시 한번, 당신은 단지 포도당 값이 얼마되지 않습니다 그러나 우리는 당신 몸이 어떻게 취급하고 있는지 이해합니다 설탕, 제 2 형 당뇨병 환자, 보다 지속적인 방식으로 그것은 또한 우리가 인구 수준에서 일어나는 일 그러나 개인적인 차원에서 일어날 수있는 일 특정 음식을 섭취 할 때 그리고 마지막으로 장치 비용을 줄이려고 노력합니다 그래서 우리는 건강을 정말로 민주화 할 수 있습니다

다음 목표는이 모든 데이터를 어떻게 구성 할 것인가입니다 그리고 저는 환자와 의사로서 말할 수 있습니다 사람들이 말할 수있는 것은 데이터가 놀랍고, 쓰나미로 데이터를 압도하지 마십시오 당신은 그것을 조직해야합니다 그래서 우리는 사노피와 파트너십을 맺었습니다

Onduo라는 회사에서 그리고 그 생각은 환자를 그들의 보살핌과 도움의 중심에 당뇨 관리를 단순화합니다 이것은 정말 누군가의 마음에 도착합니다 누가 더 행복하고 건강해질 것인가 그렇다면 실제로 무엇을 의미합니까? 우리가하려는 일은 사람들에게 힘을 실어주는 것입니다 그들의 포도당 제어와 함께

그래서 우리는 미국 당뇨병 협회 권장 포도당 범위를 살펴보십시오 그러면 사람들이 당신에게 보여주는 그래프를 얻습니다 하루의 모습과 시간의 비율 너는 범위 안에있다 다시, 환자 또는 사용자에게 제공 그 데이터는 그들이 결정의 중심이 될 수 있도록 – 마지막으로 Google 피트니스를 통해 단계를 추적합니다 다음 목표는 이해하려고 노력하는 것입니다

포도당이 당신의 활동과식이 요법과 어떻게 조화를 이루고 있는지 여기에는 프롬프트를 표시하는 앱이 있습니다 음식 사진 그리고 이미지 인식을 사용하고 Google의 TensorFlow를 사용하여, 우리는 음식을 식별 할 수 있습니다 그리고 이것이 진정한 개인적 통찰력이있는 곳입니다

진짜가되기 시작하십시오 왜냐하면 당신이 특정 식사를 먹으면, 몸이 어떻게 끝나는 지 이해하는 것이 도움이됩니다 그것과 관련있다 그리고 흥미로운 예비 자료가 있습니다 미생물이 변할 수 있음을 시사한다

내가 바나나에 반응 한 방식, 예를 들면, 그렇지 않으면 응답 할 수 있습니다 그리고 그것은 모두가 중요하기 때문에 중요합니다 우리가 만드는 일반적인 권고 사항이 갑자기 의사로서 누군가 나를 클리닉에서 보러 오면 2 형 당뇨병이 있습니다

여기 당신이해야 할 일들이 있습니다 당신은 당신의 다이어트, 운동, 구두 약을 복용하십시오 인슐린, 운동도 받아야합니다 당신은 당신의 발 의사, 당신의 눈을보아야 만합니다 의사, 주치의, 및 endocrinologist

그리고 그것은 통합 할 것이 많습니다 그래서 우리가하려고하는 것은 쌍입니다 이 모든 정보는 간병과 함께 간단한 방법으로 제공됩니다 이 여행을 돕는 사람입니다 이 정보가 떠오르면 내가 여기서 너에게 보여준 것의 가운데를 들여다 보면 의료지도와 그 사람이 보는 것, 당신은 여러 다른 라인을 볼 수 있습니다

드릴 다운하고 살펴보기를 바랍니다 이것은 데이터 간의 차이점을 보여줍니다 에피소드 식 포도당 예제에서 볼 수 있습니다 또는 지속적인 포도당 모니터로보고있는 것 이 새로운 감지로 가능합니다 그리고 우리가이 연속 포도당을 뚫어 말하며 모니터하고 우리는 일의 클러스터를 봅니다

이것은 하나의 예입니다 우리는 패턴을보기 시작할 것입니다 릴리가 언급했듯이 이것은 유형의 것이 아닙니다 개별 환자, 간병인 또는 의사가 파고 있지만, 여기가 당신은 학습 모델의 힘을 풀기 시작합니다 우리가 볼 수있는 것은 클러스터입니다

다른 아침의 우리는 긍정적 인 연관성을 만들거야 모두가 여기에서 믿을 수 없을만큼 건강하게 먹는다고 Google I / O에서 빨간색 아침의 클러스터가 될 수도 있습니다 하지만 우리는 일상 생활로 돌아가서 스트레스를받습니다 우리는 다른 종류의 음식을 먹고 있습니다

그러나 대신에, 일반적인 조언을하는 대신에, 우리는 다른 모델을 사용하여 지적 할 수 있습니다 뭔가 진행되고있는 것처럼 보입니다 예를 들어 환자 한 명과 수요일 즈음에 군집이 보였다 그래서 수요일에 무슨 일이 일어나고있는거야? 그 사람이 가고 멈추고 있는가? 특정 위치 또는 어쩌면 거기에 있습니다 그날 많은 스트레스

그러나 다시 한번, 일반적인주의를 기울이지 않고, 가장 포괄적 인 방법으로 치료를 시작할 수 있습니다 실용 가능한 예 다시 한번 우리가 말하는 것에 대해 생각해보십시오 데이터 수집, 구성 및 활성화 매우 관련성이 높습니다 이것이 우리가 당뇨병 관리에 관해 생각하는 방식입니다

이것이 바로 AI가 작동하는 방식입니다 우리는 오늘 아침 다른 토론에서 들었습니다 우리는 문제에 대해 생각해 봐야 해 우리는 이러한 도구를 사용하여 실제로 만들 것입니다 차이

그래서 우리가 생각할 수있는 다른 방법은 무엇입니까? 정보 활성화에 대해서? 그리고 릴리에게서 당뇨병 성 망막증 실명의 주요 원인 중 하나입니다 우리가 뛰어난 포도당 관리를하더라도, 말기 장기 손상이 시작될 수도 있습니다 그리고 나는 그 상승 된 포도당을 언급했다 레벨이 결국 안저 및 망막에 영향을 줄 수 있습니다 이제 당뇨병 환자들 심사를 받아야합니다

하지만 이전에 내가 너에게 준 이야기에서 우리가 환자에게 묻는 것의 세탁 목록 당뇨병에 걸린 사람 그래서이 공동 작업으로 우리가하려는 일은 구글과 함께, 어떻게 우리가 실제로 제품을 앞서 생각하고 생각하다 우리가 실현할 수 있도록 엔드 – 투 – 엔드 솔루션에 대해 오늘날 존재하는 어려움을 제거하십시오 이 문제는 상영에 관한 한 그 중 하나이기 때문에 내게 필요한 옵션이며 다른 하나는 검안의와 안과 의사에게 접근 할 수 있습니다

그리고 이것은 미국의 문제입니다 개발 도상국 에서뿐만 아니라 그래서 이것은 단지 문제가 아니라 지역적 문제입니다 이것은 우리가 매우 세계적으로 생각할 때입니다 우리는 해결책에 대해 생각합니다 우리는이 데이터를 일찍이 생각해 보았습니다

우리는 알고리즘을 사용할 수 있고 두 감도 모두를 높일 수 있습니다 당뇨 망막 병증의 진단과 특이도 황반부 종 그리고 이것은 "JAMA"에 게시 된 데이터입니다 릴리가 잘 설명했듯이 그렇다면 우리는 어떻게 생각할 것인가? 이 제품을 만드는 방법에 대해? 알파벳 같은 장소에서 일하는 것의 아름다움 오늘 당신과 같은 파트너와 함께 일하는 것이 우리 모두입니다

생각할 수있는 것, 우리가 해결해야 할 문제가 무엇인지, 알고리즘을 작성하십시오 그러나 우리는 그 때 뒤로 물러 설 필요가있다 보건 분야에서 활동한다는 의미 그리고 생명 과학의 공간에서? 우리는 이미지 획득, 알고리즘, 그 정보를 전달하는 것 의사뿐 아니라 환자에게도 도움이됩니다 우리가하는 일은이 정보를 취하는 것입니다 현재 일부 파트너와 협력하고 있습니다

현재 유망한 파일럿이 있습니다 인도에서와 마찬가지로, 우리는 듣고 싶습니다 이른 피드백 그리고 두 가지 정보가 있습니다 나는 너와 나누고 싶었다

하나는이 초기 관측을보고, 우리는 AI로 더 높은 정확도를보고 있습니다 더 큰 매뉴얼보다 의사로서 중요한 것은 – 방에 다른 의사가 있는지 나는 모른다 하지만 내가 항상 사람들에게 말하는 부분은 건강 관리 제공자를위한 공간이 될 것입니다 이 도구들이하는 일은 단지 우리가 일하는 것을 돕는 것입니다

그래서 때로는 사람들이 나에게 묻습니다 기술과 인공 지능입니다 의사를 대신하거나 의료 제도를 대체 할 것인가? 그리고 제가 생각하기에 그것은 단지 작품을 증대시키는 것입니다 우리는하다 청진기에 대해 생각한다면 – 그래서 저는 심장 전문의이고 청진기입니다

약 200 년 전에 발명되었습니다 우리가하는 일을 대체하지는 않습니다 그것은 단순히 우리가하는 일을 보강합니다 그리고 나는 우리가 계속하는 것과 비슷한 주제를 보게 될 것이라고 생각합니다 더 많은 것을 돌보는 방법에 대해 생각해보십시오

환자에게 효과적인 방법 그래서 여기서 가장 먼저 AI가 더 잘 수행되고 있다는 것입니다 수동 그레이더보다 그리고 두 번째로 생각하는 것입니다 그 환자 기초에 대해서

우리는 어떻게 진료를 진정으로 민주화합니까? 그리고 조종사에게서 다른 격려하는 조각 우리가 시작할 수있는 아이디어였다 알고리즘으로 치료받는 환자의 기반을 증가시킨다 이제 밝혀 졌을 때, 나는 좋아할 것입니다 건강하게 모든 것을하는 것이 정말 쉽다는 것을 말하고 있습니다 간호 및 생명 과학

그러나 그것이 나왔던 것에 따라, 그것은 거대한 마을을 필요로한다 이런 종류의 일을하는 것 그럼 다음은 뭐니? 임상 입양의 경로는 무엇입니까? 그리고 이것은 이것이 대단히 흥미로 웠습니다 많은 재능있는 기술자들과 일하는 의사가 되라 및 엔지니어 우리는 이제 다른 임상 사이트와 파트너가되어야합니다

나는 여기서 언급했다 우리는 또한 FDA, 유럽 ​​및 그 밖의 규제 기관들도 마찬가지입니다 우리가하기로 결정한 진실로 한 가지 FDA 사전 인증이라고 불리는 것에 속하는 것입니다 프로그램 우리는 새로운 기술과 새로운 알고리즘 의료 보험에 가입하는 것이 중요하지만 지금은 그 방법을 알아 내야합니다

둘 다 안전하고 효과적입니다 그리고 저는 Alphabet에서 우리를 자랑스럽게 생각합니다 앞서 나가고 파트너 관계를 유지하십시오 FDA와 같은 단체들과 주의해야 할 두 번째 사항 우리가 진실로 진실로 Google 및 Nikon 및 Optus와 같은 다른 파트너와 함께 이 모든 것들이 모여 든다 진료를 변형시키려는 시도

그러나 나는 이것이 올바르게하면, 당뇨병뿐만 아니라 실제로 큰 기회가 있습니다 건강 정보의 전 세계에서 그것에 대해 생각하는 것은 흥미 롭습니다 내 시간을 대부분 보살 피는 의사로서 병원에있는 환자의 보살핌에 더 많은 접근을 시작하십시오 병원 밖에서? 하지만 우리가 잘한다면 우리가 앞서 나가면이 격차를 좁힐 수 있습니다 더 예방적인 방법을 찾아 낼 수 있습니다

우리는 올바른 정보를 수집 할 수 있습니다 우리는 인프라를 구성하여이를 구성 할 수 있습니다 그리고 가장 중요한 것은 그것을 활성화하는 방법을 알아낼 것입니다 그러나 나는 모두가 여기에서 알고 싶어한다 이것은 우리가 홀로 할 수있는 일이 아닙니다

정말로 우리 모두를 필요로합니다 그리고 Verily, 우리는 Google에, 우리는 Alphabet 여러분 모두와 함께 할 수 있기를 기대합니다 그래서이 여행에서 우리를 도와주세요 이 대화 후에 릴리와 나는 여기있을 것이다 우리는 여러분 모두와 행복하게 대화 할 수 있습니다

I / O에서 시간을내어 주셔서 감사합니다 [음악 재생]

Deep Learning Images for Google Compute Engine

[음악 재생] VIACHESLAV KOVALEVSKYI : 안녕하세요 오늘은 깊은 학습 이미지에 대해 이야기하겠습니다

Google Compute Engine 용 그리고 이것은 흥미로운 주제입니다 그리고이 주제의 본질은 흥미 롭습니다 많은 모임과 많은 활동 활동이 끝날 때까지 보여주는 방법 새롭고 멋진 것을 만들어야합니다 그러나 깊은 학습 이미지는 도구이며, 자신의 프로젝트에서 사용해야하는 도구 아마 오늘 우리는 가지 않을거야

당신이 만들 수있는 특별한 멋진 것들을 망라합니다 나는이 도구를 설명하려고 노력할 것이다 그리고 사람들이 어떻게 활용하는지 알게 되길 바랍니다 이 도구는 자신의 프로젝트에 있습니다 그래서 우리가 깊은 학습 이미지에 대해 말할 것 인 동안, 때때로 나는 다른 명령을 사용할 것이다

일할 때 내 삶을 단순하게 해준다 깊은 학습 이미지와 실제로는 Google Compute 엔진 이것은 GitHub 페이지의 링크입니다 정확히 모든 명령이 있습니다 오늘 내가 보여줄 것입니다

이 링크는 Meetup의 후속 조치 노트에 있습니다 그래서 랩톱을 가지고 있지 않고 그것을 쓰고 싶지 않다면 지금은 절대적으로 괜찮습니다 이것은 설문 조사의 QR 코드입니다 하지만 조금 후에 설문 조사를하겠습니다 이 QR 코드가 다시 표시됩니다

하나의 주된 질문에 대답하면서 시작하겠습니다 깊은 학습 이미지 란 무엇입니까? 깊은 학습 이미지는 기본적으로 다른 VM 이미지 세트 깊은 학습을하기 위해 필요한 모든 것을 갖추고 있습니다 상자 밖으로 연구 몇 가지 핵심 사항이 있습니다 이것은 가상 시스템에 대한 하나의 이미지가 아닙니다

이것은 일련의 이미지입니다 우리는 실제로 서로 다른 이미지를 가지고 있습니다 이것은 모두를 설명하는 그래프입니다 그리고 우리는 나중에이 그래프로 돌아올 것입니다 그러나 요지는 단지 하나의 이미지가 아닙니다

두 번째 요점은 상자 밖에서 작동한다는 것입니다 그래서 그것은 무엇을 의미합니까? 그리고 그것이 실제로 중요한 이유는 무엇입니까? Bob을 만나 봅시다 그래서 Bob입니다 Bob은 깊은 학습을 원합니다 깊은 학습을하기 위해 그는 빌드하고 싶어합니다

자신 만의 가상 머신 깊은 학습에 필요합니다 그렇게하기 위해 Bob이 TensorFlow와 GPU를 사용하기를 원한다면, 그는 실제로 어떤 것을 알아 내야하는지 CUDA의 특정 버전은 TensorFlow에서 필요합니다 과거에 당신 중 누구라도 CUDA로 TensorFlow를 설정하려고 시도했지만, 당신은 아마 심지어 알아낼 수 있습니다 정확한 버전의 CUDA가 필요합니다 간단한 작업이 아닙니다

그건 그렇고, 얼마나 많은 사람들이 설치 했니? 로컬 컴퓨터에서 직접 GPU로 TensorFlow, Mac OS, 또는 구름에? 승인 꽤 많은 수 좋은 그래서 당신은 고통을 압니다 다음으로, 당신이 CUDA를 알아 내면, CUDA가 사용하는 정확한 드라이버를 알아야합니다

그리고 그 드라이버를 설치해야합니다 그런 다음 CUDA를 설치할 수 있습니다 그런 다음 CuDNN의 정확한 버전을 알아 내야합니다 TensorFlow가 필요하며 설치하십시오 그리고 NCCL은 TensorFlow 1

10부터 시작하여, 설치하지 않으면 실제로 작동하지 않습니다 올바른 NCCL 바이너리 그리고 마지막으로 TensorFlow를 설치할 수 있습니다 무언가 잘못되면 아마도 전혀 일하지 않을 것입니다 승인

자, Bob이 VM의 설정을 완료했다고 가정 해 봅시다 몇몇 GPU V100 설정은 다음과 같습니다 그래서 이것은 Bob의 정확한 설정입니다 완료, TensorFlow 1

9, CUDA 90, CuDNN 7, NCCL이 설치되지 않았습니다 합리적인 질문 – 이것이 가능한 최상의 구성인가? 그게 당신이 돈을 최대한 활용할 수있게 해줍니다 인스턴스를 지불하고 있습니까? 이제 기준선을 살펴 보겠습니다 그래서 이것은 속도의 기준선입니다

이것은 우리가 방금 Bob이 논의한 구성입니다 CuDNN 71 및 최신 NCCL로 전환하면, 10 %의 성능 향상 효과가 있습니다 원래 구성으로 가지고 있던 것의 위에 그래서 생각할지도 모릅니다

좋아요 최신 CUDA를 사용하십시오 최신 드라이버, 최신 CuDNN을 설치하고 잊어 버리십시오 그것은 나에게 최대의 성능을 줄 것이다 이 생각이 나타 났을지라도 CUDA 9

1이 출시되면 91이 실제로 느려지는 것을 볼 수 있습니다 TensorFlow 다운 그래서 최신의 것을 사용했다면, CUDA 91이 출시 될 무렵에는 최상의 구성을 사용하고 있지 않습니다

그리고 최신 92를 사용하고 있다면, 당신은 실제로 15 %의 성능 향상을 보입니다 승인 Bob이 실제로 이것을 어떻게 알 수 있습니까? 어떤 구성이 최선인지 그의 특별한 경우에요? 이것을 파악하려면 TensorFlow를 컴파일해야합니다 다른 CUDA를 사용하는 다른 방법은 없습니다

원본에서 컴파일하는 것을 제외하고는 공식 바이너리는 CUDA 90 기간만을 사용하고 있습니다 당신은 다른 것을 사용할 수 없습니다 그런 다음 특정 모델로 실험을 실행해야합니다

인스턴스에서이 새로운 TensorFlow 실제로 컴파일 한 파일은 후원 그리고 약 12 ​​개의 바이너리를 빌드해야합니다 세 가지 다른 CUDA가 있습니다 두 가지 다른 CuDNN이 있습니다 두 가지 NCCL 옵션이 있습니다

그리고 [? Anton 's?] Python 2, Python 3 사용에 관해 말하기 따라서 소스에서 컴파일해야하는 12 개의 바이너리 새로운 Nvidia 스택이 출시되면, 또는 새로운 TensorFlow가 출시되면 이 모든 것을 처음부터 시작해야합니다 성능은 실제로 새로운 스택으로 변경되기 때문입니다 그리고 이것은 정확하게 우리 팀이 플레이하는 곳입니다

우리는 정확하게 파악하는 데 집중하고 있습니다 어떤 깊은 학습 프레임 워크의 특정 구성 하드웨어에서 최대한의 성능을 끌어낼 것입니다 Google Compute Engine에 있습니다 그래서 우리는 각각의 새로운 그것을 컴파일하는 방법을 공개하십시오 당신 돈의 Google Compute에서 보유하고있는 내용과 TensorFlow의 공식 이미지에 포함 된 엔진 방금 다운로드 할 수있는 차이점이 표시됩니다

CUDA와 함께 우리는 92를 사용하고 TensorFlow는 90을 사용합니다 우리는 같은 CuDNN 있습니다

우리는 NCCL을 사용하고 있습니다 사실 110 [INAUDIBLE]도 NCCL 사용을 시작합니다 우리는 MKL을 사용하고 있습니다 CPU 인스턴스 만위한 MKL

그리고 MKL이 무엇인지 모를지라도, 비 GPU 인스턴스의 MKL이 당신을 포기할 수 있습니다 5 배의 성능 향상 5 번과 마찬가지로 빨리 비교할 수있는 무언가가 있습니다 공식 빌드 승인

그래서 이것은 당신이 이미지의 내부에 들어가는 것입니다, 이미 사전 구축, 구성 및 작동 준비가 완료되었습니다 이제,이 깊은 학습 이미지가 어디에 적합한 지 물어볼 수 있습니다 우리의 모든 다른 제품 중에서 Kubeflow가 있습니다 우리는 기계 학습 엔진을 가지고 있습니다

우리에게는 Colab과 다른 모든 것들이 있습니다 우리가 시장에서 제공하는 것 그래서 당신이 다른 제품의이 마술적인 줄을 본다면, 가장 왼쪽면이 완전히 관리되는 솔루션이라고 가정 해 보겠습니다 Machine Learning Engine 또는 Colab과 같은 것입니다 그리고 오른쪽이 솔루션입니다

데이터 센터와 컴퓨터에있는 것입니다 그리고 기본적으로 오른쪽 저쪽에있는 어딘가에, Google Compute Engine이 있습니다 당신은 당신이 원하는 것을 무엇이든 할 수 있습니다 아마 어딘가에 Kubernetes와 Kubeflow가 있습니다 아직 완전히 관리되지 않았습니다

GCE에서 기계에 접근 할 수있다 비록 당신이 Kubernetes를 달리고 있다고하더라도 이 멋진 남자의 인용문을 보여 드리죠 또한이 인용문이 무엇인지 기억하는 사람은 누구입니까? 이 견적을 누가 기억합니까? 그것은 오래된 인용문입니다 괜찮아

승인 승인 나는 한 손을 본다 관객 : Google 검색 사람들이 Google 검색을 잘못 입력 한 경우 VIACHESLAV KOVALEVSKYI : 닫기

하지만 실제로 그는 아마도 두 번 말했을 것입니다 누가 알아 그러나 그가 언급했을 때 한 가지는 Google Cloud가 처음 출시되었을 때 단 하나의 헌금이있었습니다 우리는 App Engine을 가지고있었습니다 App Engine은 정말 좋은 기술이었습니다

시장에 출시 된 최초의 서버리스 기술이었습니다 저 밖에 그러나 문제는 고객이 완전히 준비 됐어 그들은 투자 할 자원이 없었고, 그 당시에 모든 것을 브랜드로 옮기기 이전에는 볼 수 없었던 새롭고 새로운 접근 방식 그래서 에릭 슈미트 (Eric Schmidt) 우리는이 밝은 미래를 가지고 있습니다

그러나 우리는 고객이 현재있는 곳에서 고객을 만나야합니다 그리고 Google Cloud는 실제로 Google Compute를 도입했습니다 엔진 이제 우리의 깊은 학습 이미지가 바로 여기에 있습니다 그들은 자신의 솔루션을 가지고있는 곳입니다

당신은 당신 자신의 연구 파일, 논리를 가지고 있습니다 자신 만의 스핀 업 클러스터 솔루션이 있습니다 지금 원하지 않거나 어디로 든 이동할 수 없습니다 지금은 투자 할 수 없습니다 그러나 당신에게는 많은 유산이 있습니다

어딘가에 그것을 실행해야합니다 따라서 TensorFlow 또는 GPU로 실행해야하는 경우 GPU, 당신은 우리의 고객입니다 그것을 다룰 수있는 최상의 이미지를 만들어 낼 것입니다 승인 사용 방법? 이미지를 사용하는 몇 가지 방법이 있습니다

실제로 두 가지 가능한 주요 용도 우리는 UI 또는 CLI입니다 UI는 매우 단순하고 자기 탐색 적입니다 나는 그 부분을 실제로 만질 것입니다 나는 CLI, Common Line Interface 및 그 것들에 중점을 둘 것이다

너 알아야 해 그래서 당신이해야 할 첫 번째 일은 깊은 학습을 통해 인스턴스를 만들고 싶다면 이미지는 어느 특정 풍미를 알아 낸다 당신은 사용하고 싶습니다 이것은 현재의 맛의 그래프입니다 우리가 지금 제공하고있는 것 보시다시피, 우리는 두 가지 주요 프레임 워크, TensorFlow 및 PyTorch

그리고 만약 당신이 뭔가 다른 것을 필요로한다면, 말 그대로 CUDA가 필요합니다 CUDA의 다른 버전과 공통점이 있습니다 그래서 우선, 우리는 알아낼 필요가 있습니다 어떤 특정한 향기를 사용하고 싶습니다 이것은 이미지 패밀리라고도합니다

이 특정 예에서는 우리가 가족을 사용하고 있습니다 TensorFlow는 CUDA 92에서 최신 버전입니다 이것은 가족이 지정된 곳입니다 그리고 얼마나 많은 사람들이 만들고 있습니다

Google Compute에서 인스턴스를 생성하고 재생했습니다 엔진 또는 과거의 다른 클라우드 공급자? 꽤 많은 수 좋은 따라서 Google Compute Engine에서 인스턴스를 만드는 경우, 이미지의 패밀리를 지정할 수있는 기능이 있습니다 Docker 태그를 사용했다면 가족에 관해 생각할 수 있습니다

항상 최신 Docker Container를 가리 킵니다 그리고 내가 여기에서 멈춘 이유는, 문제에 대해 이야기하고 싶습니다 이미지 패밀리 또는 Docker Containers의 태그를 사용합니다 문제는, 만약 당신이 항상 최신의 것을 지적한다면, 이런 기회가있을거야 결국 나타납니다

이것은 NumPy 커뮤니티입니다 기본적으로 그들이 새로운 NumPy를 발표 할 것이라고 전 세계에 알리고 있습니다 그리고이 새로운 NumPy는 많은 것을 소개했습니다 많은 청소 그리고 이것은 많은 고객들에게 영향을 줄 수 있습니다

실제로 고객을 알고 있습니다 이 업데이트 된 NumPy로 인해 영향을 받았습니다 정확하게 이것 가족을 이용하고 있거나, Docker Container 최신 버전 사용, 아마도 최신 업데이트 보안 수정 때문에이 NumPy가 이미 포함되어 있습니다 이 NumPy가 가지고있는 것

그리고 아마도 당신을 망칠 것입니다 따라서 Docker 또는 이미지를 사용하는 경우, 직접 가족을 사용하는 것으로 전환해야합니다 다음 파이프 라인을 사용하여 제작합니다 3 단계입니다 가족으로부터 최신 이미지를 얻고 있습니다

솔루션으로 테스트하고 있습니다 그리고 당신은 자극적으로 그것을 사용하고 있습니다 언제나 이걸 좋아하세요 제발, 가족을 직접 사용하지 마세요 프로덕션에서 사용하는 경우 생산이란 교통을 제공하는 것이 아닙니다

나에게 오늘의 프로덕션은 내가 보여줄 나의 데모이다 그리고 내 데모에서는 정확한 이미지를 사용하려고합니다 당신이 추출 할 수있는 명령이 있습니다 정확하게 이미지 이름 그리고 오늘 저는 TensorFlow 최신 CPU를 사용할 것입니다

정확한 해쉬 이것은 기본적으로 사용할 이미지입니다 그리고 이제 나는 가족으로부터 나의 명령을 바꾸고있다 실제 이름으로 두 번째 – 이미지 프로젝트

우리는 실제로 일부 고객을 보유하고 있습니다 인스턴스를 만들 때, 프로젝트에 프로젝트를 설정하고 있습니다 그러나 이것은 우리의 이미지 인 이미지를 호스팅하는 프로젝트입니다 정책을 유지하십시오 문제는 GPU를 사용하는 경우, 인스턴스를 다른 하드웨어로 실시간 마이그레이션 할 수 없음 기계

이건 매우 중요합니다 그리고 이것을 고려할 때 이것을 알아야합니다 유지 관리를 위해 GPU를 사용하는 경우, 유일한 방법은 인스턴스를 실제로 종료하는 것입니다 다음 부분은 인스턴스를 만들고 싶다면, 당신은 그 가속기가 어떻게 또는 무엇인지를 설정하고 있습니다 당신이 사용하기를 원합니다

이것은 중요한 부분입니다 특정 가속기를 선택할 필요가 없다 우리가 가지고있는 넷에서 지역에 대해 스스로를 교육해야합니다 거기에 존재한다

잘못된 지역을 지정하는 경우 가속기가 존재하지 않으면 작동하지 않습니다 그리고 올바른 영역을 설정 한 후에, 정확한 액셀러레이터 올바른 액셀러레이터를 설정하는 방법 인스턴스에 연결할 것입니다 금액이 존재하지 않으면, 다시, 인스턴스를 생성 할 수 없습니다 예를 들어, 테슬라 v100 및 네 개의 테슬라 v100이 있습니다 우리는 아직이 구성을 지원하지 않습니다

그리고 마지막 하나 – 이 부분은 기본적으로 Google에 허가권을 부여합니다 Nvidia 드라이버를 설치해야합니다 문제는 이미지가 미리 설치된 CUDA 인 CuDNN과 함께 제공된다는 것입니다 모든 것은 사전 설정되고 테스트되었습니다 Nvidia 드라이버는 예외입니다

이런 식으로 된 이유는 몇 가지 있습니다 나는 그 특별한 이유에 관해 잠수하지 않을 것이다 하지만이 깃발이 없으면 엔비디아 드라이버가 없습니다 설치된 인스턴스에서 자, 다른 무엇을 조정할 수 있습니까? 필요한 경우 미리 사용할 수있는 플래그를 설정할 수 있습니다

선매는 기본적으로 – 선매품의 개념을 누가 압니까? 승인 그래서 Google Compute Engine에는 이러한 개념이 있습니다 선취 형 인스턴스의 경우 실제로 구매하는 경우 같은 경우지만, 더 싼 가격 때문에, 단 한 가지 단점이 있습니다 이 인스턴스는 언제든지 해제 할 수 있습니다 그래

나는 개인적으로, 내가 선매 사례를 쓰고있을 때마다, 그곳에서 많은 모델을 훈련 시키면, 그러나 때때로, 그것은 아무 것도없이 꺼져 있을지도 모른다 너 어떻게 말하는거야? 어쨌든 이제는 다음과 같은 경우 할당량을 확보해야합니다 당신은 GPU를 만들고 있습니다 따라서 할당량을 요청해야합니다

선점 가능한 인스턴스에 대한 할당량이 할당량과 동일하지 않습니다 정상 인스턴스로 Nvidia P100에 대한 할당량이있는 경우, 선점 형 Nvidia P100에 대한 할당량이 필요합니다 선점 가능한 인스턴스를 시작하려면 다음으로, 이와 같은 명령을 실행하려고한다면, 가능한 가장 작은 인스턴스를 가져옵니다 나는이 사람이 하나의 코어와 1GB 미만의 메모리를 가지고 있다고 생각한다

원하는 경우 지원되는 모든 컴퓨터 유형을 연결할 수 있습니다 다음으로 디스크 유형을 설정할 수 있습니다 이것은 실제로 SSD입니다 우리는 로컬 SSD 디스크를 지원합니다 SCSI 디스크

이것은 기본적으로 측정 및 속도 중 일부입니다 우리는 로컬 SSD 디스크로 당신을 보증 할 수 있습니다 그리고 가장 중요한 것은 새로운 유형을 도입했습니다 실제로 NVMI를 사용하는 로컬 SSD 디스크 인스턴스에 대한 연결 그리고 그것은 당신에게 – 그래서 오래된 것을 가진 상단에 하나, 하단에 하나 새로운 하나 – 나는 두 번 빨리 말하지는 않겠지 만, 훈련을받는 것이 중요합니다

디스크에서 데이터를 읽는 것이 필요합니다 그리고 마지막 하나 범위 이러한 범위는 실제로 필요합니다 TPUs를 사용하고 싶다면

그리고 저는 여기에서 실제로 전환 할 것입니다 콘솔에 두 번째 TPU 노드를 만들려고합니다 우리는 TPU 노드를 만들려고합니다 몇 분 안에 그것을 사용하십시오

그리고 TPU 노드를 몇 분 만에 생성하기 때문에, 지금 TPU 노드를 시작하겠습니다 그리고 네트워크 설정을 누르고 Create를 누릅니다 자, 내가 지금 막 메타 데이터를 지정할 때 Nvidia 드라이버 설치, Google에 허가를 당신을 위해 드라이버를 설치하십시오 실제로 클러스터가있는 많은 고객 클러스터에있는 많은 기계들과 함께, 그들은 부팅 할 때 매우 중요합니다 네 대의 기계가 있다면 네 대의 기계는 각각 8 개가 있습니다

가치가있는 V100을 사용하면 부팅 시간이 3 분, 이미 12 분 동안 돈을 내고있어 그래 네 대의 기계 – 12 분 동안 만 부팅 할 수 있습니다 일반적인 질문 중 하나는 OK입니다 내 컴퓨터 부팅 시간을 줄이려면 어떻게해야합니까? 대답은 간단합니다

인스턴스를 만들려는 이미지를 얻고 있습니다 Google 클라우드에서 가져 왔습니다 우리는 깊은 학습 사례를 만들 수 있습니다 운전수가 설치 될 때까지 기다리고 있습니다 3 ~ 5 분

그것은 끔찍한 일입니다 우리가이 일을하고 있습니다 그리고 이것은 개선 될 것입니다 – 인스턴스 중단 및 자체 학습 작성 그 인스턴스의 이미지 그 간단한, 5 단계와 당신은 자신의 이미지가 있습니다 그리고 그 이미지는이 유명한 15 초 시작 시간을 갖습니다

그 GCE는 다른 이미지를 제공합니다 승인 자, 주요 부분 실제로 우리가 어떻게 사용할 수 있는지 보도록하겠습니다 먼저 주피터 랩을 보여 드리겠습니다

Jupyter Notebooks 또는 Jupyter Lab을 누가 사용 했습니까? 좋은 그래서 가장 중요한 부분은 Jupyter Lab입니다 실제로 인스턴스를 만들어 사용하십시오 그래서 복사하고 하나의 명령을 붙여 넣습니다 방금 방금 슬라이드에서 본 명령입니다

더 크게, 더 크게, 더 크게, 더 크게, 더 크게 만들자 그래서 나는 내 이미지를 가지고있다 인스턴스 이름이 있습니다 나는 구역이있다 가자

기다리 자 아마 20 초 또는 반 분이 걸릴 것입니다 이것이 CPU 인스턴스이기 때문입니다 그것은 Nvidia 드라이버를 설치하지 않을 것입니다 이것은 내가 원래 당신에게 보여준 명령입니다

이 부분은 GPU를 사용하지 않는 경우에는 필요하지 않습니다 그래서 기본적으로 이것은 끝 명령입니다 승인 인스턴스가 나타나는지 봅시다 아니

대개 30 ~ 40 초 빨라집니다 승인 우리가 기다리는 동안, 이것은 작은 개선입니다, 내가 GitHub에서 언급 한 명령 중 하나 인스턴스에 SSH 할 수있게 해주는 명령 예를 들어, gcloud 대신 gssh를 사용하여 ssh를 계산하십시오

인스턴스의 이름을 입력하십시오 작은 개선만으로도 GitHub 페이지에서 찾을 수 있습니다 인스턴스에 연결하려면, 이 gssh INSTANCE_NAME을 실행하고 zone을 지정해야합니다 및 포트 매핑 이게 너 밖에없는 유일한거야

인스턴스가 정상적으로 작동 한 후에해야합니다 Jupyter Lab을 사용하기 시작합니다 인스턴스가 작동 중입니다 그럼 실제로 해보 죠 내 명령을 복사 해 붙여 보자

이미지를 실시간으로 연결하고 있습니다 브라우저로 가자 로컬 호스트 8080을 열자 여기 Jupyter가 있습니다 GPU로 인스턴스를 만들려면 Jupyter가 있어야합니다

V100과 함께 GPU를 갖게됩니다 문자 그대로 다른 것을 할 필요가 없습니다 인스턴스 시작을 제외하고 우리는 이미 Jupyter를 돌고 있습니다 백그라운드에서 포트 8080에서 수신 대기 중입니다 너를 위해 남겨둔 유일한 것 실제로 브라우저를 여는 것입니다

그것은 문자 그대로입니다 이제, 다음 유스 케이스 다음 유스 케이스는 Colab입니다 누가 콜랩을 사용 했습니까? 승인 그래서하지 않은 당신들을 위해 콜랩이 무엇인지 보여 주도록하십시오

Colab은 기본적으로 Google 서비스입니다 클라우드의 노트북입니다 그것은 노트북과 매우 유사합니다 실제로 유사한 유스 케이스를 제공하지만, 하지만 완전히 호스팅되었습니다 그래서 당신은 뒤에 기계가 없습니다

그러나 이것은 몇 가지 함축을 만듭니다 내가 그 의미를 정확하게 보여 주도록하겠습니다 따라서 Google Cloud 프로젝트가있는 경우, 그리고 당신은 당신의 기계를 가지고 있습니다, 당신은 TPU를 안으로 가지고 있습니다, 당신이 Colab과 함께 사용하고 싶다면, 당신은 할 수 없습니다 Colab에는 Google Cloud에 대한 개념이 없기 때문에 계획 Google 클라우드 프로젝트가 있다는 것을 이해하지 못합니다

거기에있는 어떤 리소스에도 연결할 수 없습니다 그러나 랩톱 컴퓨터가 있습니다 그리고 당신의 노트북에는 연결이 있습니다 포트 매핑 8080으로 인스턴스에 연결 우리가 방금 본 이유는 정확하게 Jupyter Lab을 여는 중입니다 그리고 당신의 인스턴스는 TPU에 연결되어 있습니다

이제 마지막 부분이 누락되었습니다 포트 8080에서 Colab을 노트북에 연결하는 것입니다 그리고 이것은 정확하게 기능입니다 우리가 몇 주 전에 발표 한 이제 우리는 깊은 학습 이미지를 사용할 수있게되었습니다 Colab의 백엔드로

그리고 그것은 매우 간단하게 작동합니다 콜랩으로 돌아가겠습니다 그래서 이것은 공식 Colab입니다 폰트를 늘려 보자 이것이 공식 Colab임을 다시 한 번 확인하겠습니다

TensorFlow의 버전을 봅시다 실제로 여기에 설치되어 있습니다 그것은 뭔가를하고 있습니다 그리고 그것이 결국 효과가 있기를 바랍니다 1

9이어야합니다 예, 19입니다 클라우드의 공식 버전이기 때문입니다 이제 로컬 런타임에 연결을 눌러 보겠습니다

기본적으로이 작업은 Colab 내 로컬 런타임에 그리고 항구는 8080입니다 그리고 지금 내 컴퓨터는 포트 8080에 있습니다 깊은 학습 VM의 포트 8080의 거울을가집니다 우리가 가진 사례

연결을 눌러 보겠습니다 그게 전부 야 이제 Colab은 원격 컴퓨터를 사용하고 있습니다 따라서 TensorFlow 19를 사용하면 어제 VM 이미지를 발표했습니다

TensorFlow 110과 함께 그래, 그래, 110, 그런데, 풀려났다, 네가 소식을 듣지 않았다면 이것은 기본적으로 의미하므로 이제 Colab을 사용할 수 있습니다 원하는 것을 포함하여 PyTorch, 가능한 모든 GPU, 심지어 TPUs

제가 말했듯이, 이제 우리는 깊은 학습을 사용하고 있습니다 백 엔드 이미지, 새로운 노트북을 만들어 보겠습니다 콜랩에서 그리고 우리가 TPU를 가지고 있다는 것을 보여주기 위해서, TPU에 접근하고, 나는 하나의 세포를 운영 할 것이다 그리고 우리는 여기서 그것을 실행할 수 있습니다

하나의 셀만 TPU에 연결됩니다 먼저 내 IP 주소를 알려주십시오 오, 동일, 100101

예 그것은 동일합니다 예 실제로 연결되어 있습니다 그래서 작동합니다

이제 TPU에 Colab을 사용할 수 있습니다 내가 말했듯이, 당신은 무엇이든 할 수 있습니다 깊은 학습 이미지를 갖춘 Colab, PyTorch, 가능한 모든 GPU 이제 우리가 일반적으로하는 또 다른 질문입니다 고객이 VM 이미지를 가지고있다

아나콘다를 어떻게하면됩니까? 나는 아나콘다를 사용하고 싶다 그리고 이것은 좋은 일입니다 아나콘다 시나리오에는 몇 가지 문제가 있습니다 그리고이 문제의 원인은 아나콘다를 설치 한 경우, Anaconda 내부에 새로운 가상 환경을 만드는 경우, 해당 환경 내에 TensorFlow를 설치해야합니다 어떻게 할 수 있니? 공식 TensorFlow를 설치하려는 경우, 공식 TensorFlow에 필요하기 때문에 작동하지 않습니다

CUDA 90, 우리는 92입니다 이를 지원하기 위해 우리는 실제로 바이너리 제공, Google Compute Engine 최적화 바이너리 이미지의 내부에서 미리 구워집니다 따라서 설치가 가능합니다

이것은 작은 스크립트입니다 공식 문서에 기본적으로 경로를 인용하고 있습니다 바이너리를 미리 굽고 있습니다 그런 다음 아나콘다 내부 깊숙히 설치하면됩니다 환경

승인 다음으로, 붙어 있다면 도움을 얻을 수있는 방법 우리는 당신을 지원하기 위해 다양한 채널을 보유하고 있습니다 물론 우리에게는 공식적인 문서가 있습니다 하지만 다른 것을 원한다면 다른 블로그를 적극적으로 사용하고 있습니다

우리의 이미지에 대한 사례 전용 StackOverflow 태그가 있습니다 우리는 적극적으로 모니터링하고 있습니다 거기에 질문을 제출하십시오 우리는 상당히 적극적인 Google 그룹을 운영하고 있습니다

당신을 도울 다른 사용자와, 나 또는 내 동료가 질문을하기 전에 언제든지 개인용 트위터에서 나를 핑 (ping) 할 수 있습니다 나는 정말로 어떤 질문을해도 감사 할 것이다 너는 나에게 메일을 보낼 수 있고 나는 대답 할 것이다 너희들을위한 가능한 모든 방법

승인 간략하게 요약하면, 심층 학습 이미지 모든 것을 가지고있는 미리 굽은 이미지입니다 다른 아이디어, Jupyter Lab, Jupyter로 시작할 준비가되었습니다 노트북, Colab 백엔드 및 거의 모든 프레임 워크 당신이 상상할 수있는 자, 이것은 정말로 중요한 조사입니다

할 수 있으면, 우리가 이해하도록 도와주세요 VM의 차기 버전에서보고 싶은 것 이미지, 단위 테스트로 추가 할 항목, 우리가 지원하기를 원하는 시나리오 이 설문 조사에 참여하십시오 고맙습니다 그럼이게 내 편이야 와줘서 고마워

더 많은 피자가 아직도 남아 있기를 바랍니다 다음에 너를보고 싶어 [박수 갈채] [음악 재생]