【ML & AI】Google I/O Extended: Recap Live Japan 2019 #RecapLiveJP

화자 1 : 예에서는 제 쪽에서 네요 기계 학습과 AI의 이야기를 해 나가고 싶습니다 나도 개발자 아 도보 케이트 네요 여러분과 같은 일을하고 있습니다하면 에서 세션이 대략 13 개 정도 I / O는 있었다 합니다만 그 중에서 내가 이렇게 비비 계속 온 녀석을 같네요 이번 선택하고 왔습니다 비교적 Cloud의 이야기는별로없고 어느 쪽인가하면 TensorFlow 이라든지 그쪽이 많았 지요 에서 이번 기계 학습 이외에도군요 다양한 도우미 라든지 발표있었습니다 만 모든 가장자리 측의 AI 가장자리 측의 ML 기계 학습이라는 것이 대단한 기능되고 있었던 거죠 지금까지 Google 클라우드 측의 대량의 컴퓨팅 리소스를 사용하여 그래서 기계 학습이나 땅땅 만들어 그래서 뭔가 이렇게 재미있는 서비스 내고받는 것이 많았 습니다만 그것이 점점 이제 기술이 진화 에지 측에서도 즉 장치에서 또 그 자리에서 기계 학습한다고하는 기술이 보급되고 있습니다 다만 여기서 걸림돌이되는 것이 기계 학습이란 이렇게 가볍게 없네요 무거운 처리가 들어갑니다 Google은 아시다시피 TensorFlow라고 오픈 소스 도구를 옛날부터 제공하고 있습니다 하지만 TensorFlow 말이죠 여러분 보통으로 사용하고 아무 생각없이 학습 모델 녀석을 만들면 대개 수백 MB 든가 바보 커졌다 버립니다 그래서 그것을 그대로 모바일 앱이라고 후에는 라즈베리 파이거나 조그만 컴퓨터로 가져 오려고하면 할 수 없지는 않습니다 그러나 나도 한번 라즈빠이에 TensorFlow 녀석을 그대로 가져 오면 실제 이미지 인식하는데 2 초 정도 걸렸다니까요 무겁고 느린 조금 사용하기 어려운 스마트 폰 앱 따위에 넣어 버리면 손님이 수백 MB 다운로드하지 않으면 안 같은 네요 좀 쓸모가 없었습니다 게다가 모바일 앱이라면인가 편입 계의 조그만 장치라고 역시 배터리의 소유라는 중요하기 때문에 CPU 사용량라는 것을 최대한 낮추고 싶다는 요구도있었습니다 에지 측의 기계 학습 과제를 해결하고 모바일 앱이라면인가 에지 장치에 적합한 TensorFlow의 실행 환경을 제공하는 것이 이 TensorFlow Lite 아래에 조그 맣게 Lite라고 써 있네요 이것은 TensorFlow예요 그러나 모바일 앱이라고 라즈베리 파이 같은 조그만 컴퓨터 전문 일부 같은 새로운 실행 환경이됩니다 이것을 사용하면 먼저 모델 크기가 수백 MB라는 것이 예를 들어 4 분의 1이나 그 이하로 꽉 작게된다 또한 CPU 아니고 GPU를 사용하거나 최근 스마트 폰은 GPU 라든지 들어가 있지요 라즈빠이에도 GPU 제대로 들어 있기 때문에 그렇게 말한 것을 사용하여 실행 속도도 몇배이나 두 자릿수 배 라든지 빨라진다는 장점을 얻을 수 있습니다 때 TensorFlow Lite는 세 가지 환경에서 작동 이 왼쪽이 중간 근처 옆에서 말이죠 라즈빠이 것 같은 내장 않아도 움직이고 스마트 폰 Android iOS에서도 움직이고 그리고는 마이크로 컴퓨터로도 움직이는 우선이 스마트 폰의 이야기에서하고 싶다고 생각합니다 앞서 강씨에서 설명했습니다 있도록 ML Kit 네요 이것을 사용하면 우선 ML Kit 자체에 기계 학습 기능이 있기 때문에 그것으로 끝나는 것이라면 가장 쉽게 이군요 ML Kit에 들어있는 이미지 인식 기능을 사용하면 이것은 예 (청취 불가) 라든지 그리고는 방금 전의 AutoML Vision Edge를 사용하면 또 TensorFlow Lite 라든지 전혀 생각하지 않고 클라우드에 사진을 업로드 개 인식 이라든지 쉽게 할 수 버려 때문에 그것으로 끝나고 じゃえ하면 전혀 그걸로 오케이예요 그러나 역시 용도에 따라 다만이 TensorFlow Lite까지 내려와군요 스스로 TensorFlow Lite 모델을 설계하고 학습하는 것이 때로는 필요가 되네요 에서 그런 때 TensorFlow Lite를 사용하시면 모바일에서도 쉽게 사용할 수 있습니다 그럼 어떤 앱이 실현 가능한가 ML Kit에는 표준 기능으로는 할 수없는 았지만 TensorFlow Lite에서 제작 만하면 이런 일도 할 수있게되면 사용 예 예를 들어 이번에는 Dance Like라는 앱이 공개되어있었습니다 이것은 먼저 움직이고있는 모습을보고하자 이것은 단순한 게임에서 댄서의 춤이 나오는군요 그에 따라 플레이어 자신도 같네요 스마트 폰을 향해 춤과 같은 춤을 이렇게 오동 않으면 안되는 것이군요 에서 그러면이 댄서의 춤과 자신의 춤이 얼마나 제대로 딱 맞고 있는가하는 것을 점수로 판정 해주고 대단한 간단한 게임인데 이 가운데는 사실 매우 복잡한 기술이 움직이고 있습니다 우선 네요 이것은 분류되고 있습니다 만 이처럼 인체를 인식하고 인체의이 부품이 팔 이라든가 머리 바디라는 것을 세분화하는 기술로 인식하고있다 네요 이 플레이어 즉 자신과 이 댄서의 비디오를 각각 2 인분 실시간으로 실행하는군요 이것은 매우 무거운 처리 이군요 딥 러닝 세분화하는 것은 상당히 깊은 학습 제한 표지의 기술 그렇게 쉽게 움직이지 합니다만 이 스마트 폰의 GPU만으로하고 싶네요 이것은 클라우드 측의 기술을 전혀 사용하지 않는 것도 중요한 작업입니다 에서 TensorFlow Lite를 사용하면 지금까지 CPU뿐입니다 와우 이제 배터리의 마음이 나빠져 있던 같은 깊은 학습 앱도 GPU를 사용하여 55 배의 속도로 움직이게 되네요 또한 이번 I / O에서 발표 된 것이 Qualcomm 씨의 DSP를 지원이라면 DSP 란 Digital Signal Processor의 약자로 사실 이것은 옛날부터 스마트 폰에 들어가있었습니다 만 원래는 스마트 폰의 신호 처리 용 프로세서로 예를 들어 음성 신호를 실시간으로 처리하고 던가 이미지 처리 라든지 그러한 전용 프로세서입니다 만 사실 여기에는 GPU와 마찬가지로 이른바 적화 연산 곱셈과 덧셈을 대량으로 빠르게 할 수있는 회로가 들어하면 이것은 사용하여 AI 주면 더 빨라지 잖아 및 것으로 Qualcomm 씨와 Google에서 이번 네요 TensorFlow Lite를 DSP에서 달린다는 발표를했습니다 이것은 실제로 사용할 수있는 것은 여러분이 사용하실 것은 여름 정도예요 그러나 이것을 사용하면 GPU보다 더 빠른 13

8 배 6 밀리 세컨드로 실제 예를 들어 이미지 인식 등이 끝나 버린다는 발표가있었습니다 지금은 스마트 폰의 이야기군요 계속해서 라즈빠이 이야기 임베디드 Linux 즉 조그만 Linux 시스템 네요 3 천엔이나 5 천엔 정도에 살 수 있으며 그래도 TensorFlow Lite가 움직임 있어요 말입니다 아까 말했듯 내가 라즈빠이에서 2 ~ 3 년 전에 생 TensorFlow를 이동하면 2 초 걸렸습니다 및 그것이 얼마나 빨라 질까라는 이야기군요 에서 여기에서도 데모 비디오를 보여드립니다 이것은 말입니다 스마트 폰 앱 아니라 AI 거울이라는 거울의 데모입니다 거울 속에 디스플레이가 들어가있어 거기에 사람이 비치고 있다고하네요 그래서 안경을 주거나 머리카락의 색을 같네요 마음대로 바꿔 주기도합니다 이것은 아까와 같은 세분화하는 기술 거울의 뒷면에있는이 이것은 라즈빠이 아니 네요 어쩐지 Linux 계열의 시스템에서이 CareOS라고 어쩐지 코스메틱 계의 상품으로 취급되고있는 OS 인 것 같습니다 임베디드 OS도 이 CareOS에서 TensorFlow Lite가 GPU를 사용하여 이러한 세분화이라면인가 얼굴 인식하네요 이런 것들을 실시간으로하고하면 그래서 이런 것도 같네요 지금까지하려고하면 ARM 프로세서 CPU에서 할 필요가 있고 이런 속도 나오지 않았다 합니다만 지금부터 계시다면 TensorFlow Lite 덕분에 이러한 매우 좋은 성능을 나오게되어 있습니다 또한 지금까지 DSP거나 GPU의 이야기를 했습니다만 Google는군요 더 그 위를가는 더욱 더 빠른 딥 러닝 AI의 실행을 목표로해서 에지 용 장치 에지에서 AI의 실행을 위해 Edge TPU Tensor Processing Unit는 칩도 Google이 처음부터 설계하고 만들고 있습니다 때 로 이것은 지금 Coral라는군요 옛날 AIY 브랜드가 있었군요 그 Voice Kit이라면인가 Vision Kit 이라든지있었습니다 만 그 브랜드가 지금 새 단장해서 Coral 브랜드가되었습니다 이 Coral 브랜드 Edge TPU를 탑재 한 가속 가속 용 보드군요 장치를 지금 판매합니다 이것은 일본에서도 Mouser JP 씨에서 살 수 있습니다 지금 8 천엔 정도 일까에서 구입하실 수있어서 에서 USB로 라즈빠이이라면인가 Linux에 연결하고 또는 SOM라고 말이죠 이것은 실제로 Linux를 움직이는 조그만 보드 인데요 이 가운데 서브 보드로 올라 타있는 버전 두가지가있다하면 그럼 지금 사용할 수있는 것은이 USB 버전 이네요 이것이라면 국내에서 즉시 사용하실 수 있습니다 에서 이들을 사용하면 GPU보다 더 빠른 딥 러닝 말이죠 이 조그만 Linux 위에서도 사용할 수있게된다 이것은 속도를 비교하면 예를 들어 보통의 이미지 인식 비교하면 이것은베이스가 않은 Pixel 3 네요 Pixel 3의 CPU로 인식하는 경우에 비해 42 배 빠른 1 번 이미지를 인식하는 데 2 ​​밀리 초입니다 아까 제가 말씀 드렸듯이 라즈베리 파이 보통의 CPU로 돌리면 1 ~ 2 초 2 초 정도 걸렸습니다 그것이 지금 2 밀리 초에서 수 있도록되어 있습니다 때 그럼 그 데모도 조금 보여 드리죠 이것은 실제 I / O하던 데모입니다 그러나 이런 어쩐지 차량이라면인가 신호등입니다 라든지 보행자의 모형이 올라 오면 자꾸 이런 식으로 실시간으로 화상 인식합니다 이것이 대략 지금 2 밀리까지했다 네요 이것은 다른 오버 헤드 (청취 불가) 음 10 밀리 초 정도 실행하고 있습니다 60 프레임 당 두번째 즉 거의 실시간으로 이미지를 인식 할 수 있으므로 예를 들어 공장에서 불량품을 퐁퐁 퐁퐁 실시간으로 물리 치고 싶다 던가 불량품 인식 후에는 정말 이러한 자동 운전 같은 곳에서 즉시 실시간 인식하지 않으면 안 같은 용도에 HTP를 사용할 수 있습니다 때 에서 세 번째 플랫폼 마이크로 마이크로 컨트롤러 네요 에서 마이크로 여러분의 가정에 말이죠 반드시 몇개 있다고 생각합니다 수십 개일지도 모릅니다 예를 들어 밥솥 안에 대략 마이크로 들어가 있지요 그리고는 온수기 라든가 그리고는 TV 리모컨인데일지도 조그만 컴퓨터 이는 Linux도 움직이지 같은 엄청난 조그만 CPU가 대략 가전이나 들어 있지요 에서 당연 합니다만 리모콘이라면인가 Linux 부팅하고있어 어쩐지 시간 있지요 건전지로 움직이고 있으니까요 거기에는 대개 OS가 없어서 이제 임베디드 시스템 엔지니어 분들이 C로 작성된 원시 바이너리 코드가 있네요 ARM 프로세서 위에서 움직이거나하는 거죠 그러나 그래서 그런 대단한 조그만 초 저전력 CPU 컴퓨터 위에서는 메모리 말이죠 대략 수십 KB와 수백 KB 정도 밖에 사용할 수 없다 네요 무엇 메가도없는 경우가 많습니다 그래서 지금까지 거기에서 AI를 사용한다는 발상은 없었더라도 Google의 TensorFlow Lite 팀은 열심히 마이크로 속에서 깊은 학습을 사용할 수 없을까하는 것으로 개발을 진행하고 이것이 TensorFlow Lite 마이크로 컨트롤러라는 놈입니다 데모를 보여 드리죠 앞으로 네요 이것은 한 번 실패합니다 그러나 다시 한번 여기에 라이트가 붙습니다 번쩍 네요 "예"라고하면 노란 녀석이 번쩍 빛납니다하지만 이것은 단순한 음성 감지 네요 노란 놈이 돋보입니다하지만 이것은 단순한 음성 감지 네요 오디오 (청취 불가)까지는 가지 않습니다 어쩐지 문자 인식까지 음성 인식까지는 가지 않습니다 그러나 간단한 "예수"이라고 "OK Google"같은 녀석에 반응 뻔쩍 트리거 (청취 불가) 남중 수 밖에 없지만 이것은 엄연 깊은 학습이 움직이고 있습니다 사실이 깊은 학습 모델 20KB의 크기 이군요 20MB 잖아요 보통 아무것도 생각하지 않고 음성 인식 모델을 만들어 버리면 수백 MB 라든지되어 버립니다군요 그것이 20KB에서 움직이고있는 그래서 분명히 말해 정밀도도 안마 비싸다 하 인식 할 수있는 것도 정말 적은 단어 만입니다 만 하지만 수 버려 에서 이후 샘플 코드로 이미지 인식을 해 버리는군요 샘플도 200KB 정도에서 제공 될 예정입니다 그래서 앞으로 여러분의 가정의 마이크로 컨트롤러에 깊은 학습이 움직이기 시작하면 예를 들어 일상 생활의 패턴을 학습하여 여러분의 라이프 사이클에 맞춘 현명한 동작을하는 가전 수 있고입니다 라든지 다양한 응용이 가능한 않을까라고 생각합니다 이어 말이죠 매우 이번 커다란 컴퓨터 슈퍼 컴퓨터의 이야기입니다 이것은 내가 Google I / O에서 담당 한 세션입니다 그러나 그 TPU Tensor Processing Unit는 Google이 만든 전용 프로세서 이것을 2048 개 이은 거대한 슈퍼 컴퓨터가 이번 공개 베타 버전으로 공개 여러분 바로 사용하실 상태입니다 이것은 Cloud TPU Pod라는 놈입니다 그러나 이것은 진정한 슈퍼 컴퓨터 이군요 슈퍼 컴퓨터와 일반 컴퓨터의 차이라는 것은 프로세서 아니 네요 컴퓨터의 계산 결과 잖아요 네트워크가 전혀 다른군요 (웃음) 이것은 똑같은 옷을 입고 옷의 변형이 없음이 발레 발레입니다 그러나 (웃음) 아까의 스티브 잡스 스타일 에서 슈퍼 컴퓨터가 중요한 것은 통신이 엄청나게 빠른 보통 통신이라고하면 이더넷을 위해 TCP / IP 소프트웨어와 통신 할 잖아요 있는 절대 500 마이크로 비트 걸려 버립니다 CPU에서하는 것이어서 네요 에서 슈퍼 컴퓨터 세계에서 통신이란 다른 소프트웨어는하지 않는군요 다른 하드웨어에서 통신을 모두 할 수 없다 때문에 이쪽의 컴퓨터에서 이쪽의 컴퓨터에 복사하는데 1 마이크로 초 라든지이에요 예를 들어 이화학 연구소 교토 따위는군요 이와 유사한 기술을 사용하여 또 2 자리 3 자리 빠르게 그 TPU와 TPU 사이를 맺고 있기 때문에 엄청 빠른 학습이 가능하면 보통 이런 2048이나 노드 걸려 버리면 절대 네트워크 병목 버려서 사찌っ 버리는군요 스룻뿌 이라든지 그것없이 매우 선형에 가까운 확장 성을 제공하는 것이이 TP Pods입니다 때 에서 지금 순간 나온 데요 조금 되돌립니다 네요 미안 해요 이것의 장점은 가격이 대단히 저렴하다는군요 보통 슈퍼 컴퓨터로 만들면 이화학 연구소 경은 1 천억엔 종합적으로 달려 있지요 에서 미니 슈퍼 컴퓨터 예 NVIDIA 씨의 DGX1 2 이라든지 사면 4 천만 이라든가 게다가 16GPU 이라든지 붙어 있습니다 그러나 역시 대단한 높은 것입니다 수천만이나 1 억이나 수억 라든지 그러나 Cloud TPU Pods 32 코어 24 달러 였는지 즉 3000 엔 정도 시간당 3000 엔으로 사용하기 시작하고 초기 투자 0 엔입니다 그래서 아마 업계 최초의 AI 슈퍼 컴퓨터 렌탈 서비스 이군요 수천만이나 수억이나 지불하지 않아도 슈퍼 컴퓨터를 바로 사용 버리는 내가 실제로 포치 포치 일 때도 128 코어의 인스턴스를 만드는 데 2-3 분 또 수 버렸습니다 그래서 (청취 불가) 나는 학습 무거운라고하는 분은 Cloud TPU Pod를 사용해 주시면라고 생각합니다 그럼 이번 슈퍼 컴퓨터를 사용하여 무엇을 할 수 있는가하는 이야기입니다 만 이것을 보신 분은 많다고 생각 했는데요 이런 최근에는 가짜 이미지가 있지요 깊은 학습이 만든 이것은 개 영상이 함께 있지만 여기에 진짜 개는 한 마리도 없다 모두 합성 된 개 이미지입니다 이런 골든 리트리버와 테리어인지 뭔지 일까 사이의 이미지도 전부 이렇게 틈을 따서 만든거나 할 때 이런 고품질의 깊은 학습에서 이미지 생성을 할 때는 이 경우 512 코어를 사용하여 2 일간 계속 학습 해방에서 겨우 수 있었다는 것입니다 그렇게 말한 것이 Cloud TPU Pod 수행 할 수 있기 때문에 예를 들어 지금 잘 이야기가있는 것이군요 게임 고객 네요 캐릭터의 이미지를 사람이 그리는 것이 아니라 AI에 그리게보고 싶다라고하는 아이디어는 실제로 앞으로 시험하실 것이 아닐까라고 생각합니다 이어 웹의 세계군요 TensorFlowjs는 프레임 워크가 있나요? 이것은 JavaScript로 움직이는 TensorFlow합니다 그래서 웹 응용 프로그램에서 서버에 액세스하지 않고도 바로 이동 버린다 예를 들면 이런 식으로 얼굴의 방향을 인식 따위 이것도 js 안에서만 웹 응용 프로그램에서 속도 위반 여러가지 게임을 만들고 UI를 만들고 있으며 방금처럼 인체의 세분화 이것도군요 js에서 위지 있어요와 또한 자연 언어 처리 예 "What is the weather in Cambridge?" 뭐라고 자연 언어 네요 영어입니다 라든지 일본어 문장을 숫자의 나열로 대체 이것은 한마디하고 싶은 것을로서는 캠브리지의 기상 정보를 가져와 원하는구나라는 명령으로 변환되어 있습니다 든가 그러한 학습을 ​​js 안에서만 수 있도록되어 있습니다 실제로 사용하고있는 고객은 Airbnb 같은 것은이 js 사용자 인터페이스에서 개인 정보이라면인가 민감한 이미지 여부를 판단하는 모델이 들어가 있기 때문에 손님이 위험 정보를 같네요 업로드하려고하면 "잠깐만 요"와 "이 따위 좋습니까"라는 대화를 팝업 및 UI에서 내 버려서 (청취 불가)으로 쓰기 전에 감지하고 있습니다 라든지 등등의 사용 예입니다 그리고 좋았던 것은 TensorFlow Graphics라는 새로운 라이브러리가있어서 이것은 말입니다 보통 지금 이미지 인식 더니 2D 2 차원 이미지 인식 네요 고양이이라고 개 이니 그게 아니라 3D 모델 이군요 Unity에서 사용하고 같은 저런 3D 데이터의 이미지 인식을 할 수 있도록 지금되고 있습니다 이것은 고양이 모델 이군요 라든지 또한 분할도 3D 모델에 있습니다 3D 모델 여기가 팔이라면인가 분할도 가능하게되어 있습니다 마지막 ML Fairness는 말을하고 싶습니다 다양한 이번에도 이러한 형태에서 AI의 재미있는 기능을 많이 발표되었지만 Google Image가 가장 힘을 쏟고있다 공통점은 그런 AI의 새로운 기능을 세계의 다양한 사람들에게 안심하고 사용하실 도움 도움말 전체의 AI를 목표로하는 곳이 주력하고 있습니다 예를 들어 AI는군요 아무 생각없이 만들어 버리면 데이터에 포함 된 편향을 반영 해 버리는군요 예를 들어 신발의 그림을 그려 달라는 식으로 말해 Google의 Quick Draw 프로젝트에서 모은 선화가 있습니다 그러나 대개 구두라고하면이 위의 파란색 운동화 같은 신발을 그린 버리는 사람이 많아서 아무래도 하이힐이라면인가 또는 국가마다 여러 형태의 신발이 있다고 생각 합니다만 문화에 의해 편향이 나오고 버립니다 그래서 결과 그런 데이터에서 AI를 만들면 이 아래쪽 하이힐의 이미지는 신발로 인식되고 어렵게 할 것이군요 그런 AI의 편향을 방지하기 위해 Google은 하나하고있는 것은 Open Images Extended Open Images라는 이미지군요 학습용 데이터 세트가 이미 합니다만 대체로 지금까지의 이미지 데이터라고하는 것은 구미를 중심으로 모아지고 있기 때문에 예를 들면 일본의 결혼식 사진을 보여줘도 웨딩 인식되지 않거나 라든지 그런 문제가 있네요 이 데이터 세트는 인도입니다 이라든지 아프리카이라면인가 중동 따위를 중심으로 모아지고 있기 때문에 그런 세계의 분들 편견없이 AI를 사용하실 데이터 세트로되어 있습니다 또 Fairness 표시하는 오픈 소스 도구도 공개되어 있습니다 이것은 완성 된 AI 기계 학습 모델 그런 문화입니다 이라든지 성별이라면인가 나이 등 차이에 따라 편차가 있는지 여부를 제대로 검증하기위한 도구 이것은 Google 사내는군요 그런 걸 옛날부터 실행되고 있습니다 만 그것을 여러분에게도 사용하기위한 도구를 제공합니다 예에서 이런 형태로 ML Fairness라고 생각하네요 이것은 Google이 제시 AI의 원칙 AI 원칙들 여기에서 두 번째 말이죠 AI에 의한 여기 언페어 바이어스가 발생하지 않도록 라는 중요한 생각의 하나가되고 있습니다 즉 Google이라는 것은 단순히 유용한 것을 만들뿐만 아니라 어떻게 세상에게 도움 풀 한 AI를 만들 것인가에 주력하고 있습니다 예라고하는 느낌으로 내게는 이상입니다