Introducing Google Coral Building On Device AI Google I O'19(from Tensorflow)

[음악 재생] 빌 루앙 : 안녕하세요 Google 소개 I / O 세션에 오신 것을 환영합니다

산호 제 이름은 Bill Luan입니다 저는 Google Coral 팀의 프로그램 관리자입니다 모든 팀원을 대표하여, 너와 많은 사람들에게 따뜻한 환영 당신이 전세계 온라인으로보고 있습니다 우리와 함께 해줘서 고마워

산호 제품에 대해 이야기하기 전에, 업계를 간략하게 살펴 보겠습니다 트렌드, 왜 우리에게 보여 주는지 산호가 우리에게 중요 할 것입니다 스마트 장치 및 소위 말하는 IoT의 성장 – 사물의 인터넷 – 지난 수년 동안 엄청나게 성장했습니다 그리고 그것은 가장 큰 성장 기회 중 하나를 나타냅니다 앞으로 몇 년 안에 인터넷을 통한 많은 산업 동향 예측에 따르면, 당신이 볼 수있는 것과 인터넷에서 비슷한 것을 많이 볼 수 있습니다 PC, 노트북, PDA, 휴대 전화, 태블릿 등 5 ~ 6 개 년 약 110 억 설치 단위에서 성장할 것입니다 세계적으로 향후 5 년에서 6 년 사이에 약 120 억 이는 약 14 %의 성장률을 나타냅니다

그러나, IoT 스마트 장치, 성장 현재 설치 기반에서 약 80 억 단위의 비율 같은 기간에 전 세계적으로 210 억까지 성장할 것이며, 150 % 이상의 훨씬 더 큰 성장률을 나타냅니다 그래서 이것은 정말로 우리에게 성장 기회가 어디 있는지 말해줍니다 우리 모두를위한 혁신 기회, 세계 곳곳에있는 개발자를 위해 즉, 그들은 스마트 장치에 있습니다 따라서 스마트 장치 사용자는 계속 혁신의 관점에서 스마트 장치에 대한 관심을 키우고, 개발은 계속해서 성장할 것입니다 다음과 같은 몇 가지 핵심 요소가 있습니다

이러한 트렌드는 계속 앞으로 나아갈 것입니다 번호 하나 때문에, 증가 때문에 AI의 관점에서 전세계 관심사의 기계 학습, 발전 AI의 주요 연구 결과가 계속해서 커지고 있습니다 지난 몇 년 동안 사실, 연구 논문의 수 지난 몇 년 간 출판했다 기계 학습에서 그러한 논문의 총 수 이상이다 지난 10 년 동안 AI 기능이 더 많아 응용 프로그램을 만들 것입니다

보다 실용적인 장치에서 학습하는 인공 지능 기계의 기계 학습 모델이되기 때문에 가능하다 더 정확하고, 빠르며, 더 나은 성능, 산업은 계속해서 그들을 사용하는 데 관심을 가질 것입니다 에지에서 더 많은 장치가 기계 학습을 필요로하므로, 우리는 정말로 해결책이 있어야합니다 가장자리에있는 기기로 기기 학습을 가져옵니다 우리에게는 기술, 특히 하드웨어가 필요합니다

기계 학습 가속을 가져 오려면, 그 능력 장치에서 바로 요컨대, 스마트 장치의 성장 요구 장비 학습을 최첨단으로 가져옵니다 그리고 우리는 그것을위한 해결책이 필요합니다 그래서 Google이 당신을 위해 무엇을 만들 었는지 소개하겠습니다 전 세계 개발자들이 가능한 업계의 요구에 답할 수 있습니다

Google에서 산호를 소개합니다 새로운 흥미 진진한 기술 플랫폼입니다 전 세계의 개발자에게 기기 내 기계 학습 가속화 AI 구축 응용 프로그램을 쉽고 효율적으로 사용할 수 있습니다 그래서 이번 소개 세션에서 배울 점은 무엇입니까? 산호 제품 라인이 제공하는 것입니다 기계 학습 기능이란 무엇입니까? 산호 플랫폼과 기술로 구축 할 수 있습니다

세 번째로 용어의 유스 케이스는 무엇입니까? 응용 프로그램과 함께 기계 학습 배치 많은 산업 분야에서 그래서 저는 여기에서 제 지시를 가지고이 모든 것을 다룰 것입니다 산호초는 다음과 같이 설계되었습니다 장치에 기계 학습을 가져 오는 것, 응용 프로그램을보다 쉽게 ​​개발할 수 있습니다 프로토 타이핑 툴 생산을위한 플랫폼입니다 고속으로, 효율성으로

장치 기반 기계 학습을 개발하는 플랫폼입니다 하드웨어 구성 요소의 구성 요소 그룹을 제공합니다 고유 한 고성능 기계 학습 기능 제공 Edge 장치로 바로 연결하십시오 또한 완전한 소프트웨어 도구 세트를 제공합니다 애플리케이션을 개발할 수있게 해준다 인공 지능 기계에서 쉽게 학습 할 수 있습니다

그 외에도 Coral은 귀하가 사용할 수있는 중고 기계 학습 모델의 목록 장치에 신속하게 배포 할 수 있습니다 그래서 많은 사람들이 궁금해 할 것입니다 왜 그것을 산호라고 부릅니까? AI가 AI와 어떤 관련이 있습니까? 음, 자연 세계에서 산호의 본질을 보면, 산호는 실제로 활기차고, 포괄적 인 삶으로 가득한, 매우 열린 공동체 권리? 함께 살아있는 유기체, 그들은 공통의 이익에 기여하기 위해 함께 노력합니다 그리고 그것이 바로 우리가 고무시키는 것입니다

여러분 모두를 위해 업계를위한 플랫폼을 만들고 싶습니다 산호의 영감과 사명은 모든 사람들에게 활기찬 플랫폼을 제공합니다 가져올 애플리케이션 개발 및 공동 작업 AI 응용 프로그램을 장치에 연결합니다 우리는 어디에서나 개발자를 가능하게하고 싶습니다 AI 아이디어를 아이디어에서 비즈니스 솔루션으로 전환하는 방법 대규모 생산 배치 시제품 제작 쉽고 간단하게 그리고 마지막으로, 우리는 모두가 참여하도록 장려하고 싶습니다

기여하고 배우는 공동체 차원의 노력 기계 학습 모델을 함께 공유 할 수 있습니다 그래서 이것이 산호초의 이름입니다 그렇다면 왜 우리는 기계의 장점에 대해 이야기하고 싶습니까? 장치 학습? 그럼 무엇을 빨리 볼까요? 기계 학습의 요점 장치의 이점에 관해서 첫째로, 그것은 높은 성능 이점입니다 모든 것이 장치에서 계산되기 때문에 장치가 로컬에 있습니다

데이터를 다시 클라우드로 보낼 필요는 없습니다 권리? 높은 성능, 지역의 모든 것 훨씬 더 효율적으로 일을 할 수있게 해줍니다 또한 매우 중요합니다 바로 그 열쇠입니다 많은 응용 분야에서, 당신은 데이터가 장치에 남아 있기를 원합니다

특히 비즈니스 애플리케이션 시나리오에서 그렇습니다 일부 사용자 개인 정보 데이터는 서버로 전송 될 수 없으며, 클라우드로 보낼 수 없습니다 우리는 당신을 가능하게하는 기술이 필요합니다 고객이 해당 솔루션을 사용할 수 있도록합니다 또한 데이터가 로컬에 있기 때문에

장치의 오른쪽 센서에서 오는 모든 정보 접근 할 수 있고 계산에 사용할 수있다 귀하의 기계 학습 결과 바로 거기, 오히려 데이터를 클라우드, 서버로 보내야하는 것보다, 데이터를 계산하여 다시 보냅니다 권리? 그래서 이것은 이것을 보는 또 다른 방법입니다 훨씬 더 나은 성능입니다 모든 데이터를 로컬에서 감사 할 수 있기 때문입니다

다음은 오프라인 작품입니다 많은 시나리오가 있습니다 – 사물의 인터넷, 스마트 장치들 – 인터넷에 연결되어 있거나되지 않을 수 있습니다 실제로 대부분의 경우 클라우드 연결이 없습니다 그래서 당신은 여전히 ​​기계 학습을 원합니다 기능을 제공합니다

오프라인 장치 내 기계 학습 기능 그 일이 당신을 위해 일어날 것입니다 마지막으로 훨씬 더 효율적인 전력입니다 많은 가장자리 장치는 작습니다 그들은 큰 전원 공급 장치가 없습니다 또한 컴퓨팅 측면에서 높은 효율성이 요구됩니다

장치에 대한 계산 데이터를 다시 클라우드로 보낼 필요가 없기 때문에, 물론 대역폭을 절약 할 수 있습니다 네트워크에 Wi-Fi를 사용하도록 데이터를 전송하는 전원을 절약 할 수 있습니다 따라서 기계 학습의 이점 매우 강력한 기기 내 학습이 매우 강력합니다 이제 Coral 제품 라인을 간략하게 살펴 보겠습니다

우리는 업계에 무엇을 제공합니까? Coral 제품 라인은 두 가지 하드웨어 구성 요소를 모두 제공합니다 및 소프트웨어 구성 요소 하드웨어 측면에서 개발을 제공합니다 단일 국경 컴퓨터 인 보드에 개발자 응용 프로그램을 프로토 타입 화합니다 또한 Coral은 여러 센서를 제공합니다

를 사용하여 응용 프로그램을 빌드 할 수 있습니다 이미징 측면에서의 감각 데이터, 비디오, 환경 센서, 제작 데이터 입력의 일부로서 이용 가능한 것들 귀하의 응용 프로그램에 또한 소프트웨어 측면에서 우리는 소프트웨어 도구 변경의 완벽한 세트를 제공한다 운영 체제에서 SDK, 컴퓨터로 학습 모듈을 사용하면 쉽게 사용하고 신속하게 학습 할 수 있습니다 응용 프로그램을 빌드하십시오

그 외에도 우리는 상세한 종합 세트를 제공합니다 문서, 예제, 온라인 가이드, 데이터 시트 등 이들 모두는 Coral 웹 사이트에서 온라인으로 제공되었습니다 너희 모두에게 이제 우리는 산호 제품군에 무엇이 포함되어 있는지 알고 있습니다

조금 더 자세하게 살펴 보겠습니다 하드웨어 구성 요소의 측면에서 그래서 산호의 하드웨어 제품 우리는 당신에게 하드웨어 세트를 제공합니다 프로토 타이핑 및 응용 프로그램 개발과 관련하여 첫 번째는 Coral Dev Board입니다

당신이 그림의 여기에서 알 수있는 것에 따라, 약 150 달러에 소매됩니다 운영 체제가있는 단일 보드 컴퓨터입니다 온보드 및 기계 학습 기능을 제공합니다 두 번째는 USB 키이며 우리가 USB 가속기라고 부르는 것입니다 그것은 가장자리 칩 TPO 기계 가속 칩을 가지고 있습니다

장치에서 바로 이 USB를 모든 리눅스 머신에 넣을 수 있습니다 기계 학습 기능을 올바르게 구현할 수 있습니다 그 장치에 그리고 나는 나와 함께있는 사람들이있다

그리고 상대적인 크기를 보여주고 싶습니다 그것의 차원 이것이 코럴 데 보드입니다 보시다시피, 매우 작습니다 그것은 모든 단일 보드 컴퓨터입니다 커넥터에 필요한 입출력

이것은 USB 키입니다, 더 작습니다 그것은 당신이 사용하는 모든 USB 키에 전형적인 것입니다 그래서 이들은 현재의 두 컴퓨터 플랫폼입니다 당신은 응용 프로그램을 개발하는 데 사용합니다 그 외에도 우리는 두 개의 센서를 제공하며, 내가 말했듯이, 기계의 현장에서 감지 데이터를 가져 오는 것입니다

학습 응용 프로그램을 사용합니다 1 위는 5 메가 픽셀 자동 초점 카메라이며, 우리가 산호 카메라라고 부르는 것 둘째, 방금 며칠 전에 발표했습니다 여기에 새로운 환경 센서가 있습니다 보시다시피, 매우 작습니다

그리고 그것에는 디지털 디스플레이가 있습니다 그것은 당신이 온도, 습도, 빛 등등 이 입력 센서는이를 사용하고 빌드 할 수 있습니다 귀하의 응용 프로그램에 적합합니다 이제 이것들을 사용하여 프로토 타입을 작성하십시오

그러나 이러한 장치를 배포 할 때 최대 규모의 생산 환경으로, 우리는 당신이 태양을 가져갈 수 있도록 허용합니다 모듈을 개발 보드에서 가져온다 즉, 회로 기판의이 부분은 스냅 할 수 있습니다 제품에 포함시킬 수 있습니다 그리고 이것은 대용량 배포를위한 것입니다

그리고 볼 수 있듯이 개별 단위 가격은 약 115 달러입니다 또한 볼륨 배포에 대한 할인을 제공합니다 곧 다음 분기에 PCI-E 커넥터를 제공 할 예정입니다 PC 또는 산업용으로 연결할 수있는 기본 커넥터 PCI-E를 허용하는 PC 및 산업 장치 기계 학습 기능을 가져올 수있는 커넥터 그 장치에 왼쪽에있는 사람들은 당신이 귀하의 기계 학습 응용 프로그램을위한 프로토 타이핑을해야합니다

오른쪽에있는 건 – 오른쪽에있는 것은 대규모 배치를위한 것입니다 물론 센서와 카메라의 환경, 당신은 프로토 타이핑과 더 큰 대규모 배포로 중간에 위치합니다 좋아, Google Edge TPU에 대해 이야기 해 보겠습니다 이것이이 플랫폼의 핵심 인 센터입니다 기계 학습 기능을 장치에 가져옵니다

따라서 Edge TPU는 작은 응용 프로그램 별 원형입니다 Google이 특별히 설계 한 칩 장치에서 기계 학습을 최적화합니다 TensorFlow Lite를 사용하도록 설계되었습니다 기계 학습 모듈 또한 8 비트 quantile TensorFlow 모델 및 실행을 지원합니다

고효율의 온 – 디바이스 그것은 단지 2 와트 전력을 소모합니다 그리고 그것은 매우 빨리 달립니다 중간에 보이는 그림 페니에 대한 상대 크기를 나타냅니다 그래서 그것은 아주 작은 칩입니다

그리고이 크기의 동일한 모듈로, 많은 장치에 쉽게 내장 할 수 있습니다 그러면이 가장자리 TPU는 얼마나 빨라 집니까? 글쎄, 일반적인 시간에, 우리가 온라인으로 출판하는 것, Edge TPU의 성능 속도 초 당 약 4 조 연산으로 계산을 실행합니다 따라서 일반적으로 4 가지 TOPS입니다 당신은 물어볼 수 있습니다, 글쎄, 얼마나 빨리 실제로 기계 학습 모델을 실행합니까? 이 비교표를보십시오 우리는 매우 일반적으로 사용되는 벤치마킹 몇 가지를 주로 사용했습니다

비전 머신 학습 모델, MobileNet, Inception 우리는 dev 보드 또는 Edge TPU USB를 실행 중입니다 강력한 CPU 또는 임베디드 CPU에 대해 실행되는이 두 가지 모두에서, Xenon 64 비트 CPU와 같은 강력한 데스크탑 CPU 또는 임베디드 세계의 ARM CPU 비교해 보면이 표에서 알 수 있듯이, 가장자리 TPU의 기계 학습 능력 속도 필요한 시간의 일부만 실행합니다 데스크톱 CPU와 임베디드 CPU에 비해 그래서 훨씬 더 빠릅니다 이제 여러분 중 일부는 말합니다

이들은 단지 벤치 마크 번호입니다 예를 들어 있습니까? 현실 세계의 예를 보여 주실 수 있습니까? 그리고 나는 그렇다고 말합니다 베타 사용자 중 한 명에게서 예제를 빌려 드리겠습니다 Coral 베타 온라인 포럼에 게시했습니다 그는 말하기를, 나는 온라인 트래픽을 모니터링하는 앱을 만들고있다

실시간 10, 20 대의 자동차를 실시간으로보고 있습니다 나는 모바일 넷을 상자에서 꺼내기 만하면된다 별로 조정하지 않고 그리고 저는 산호 제품을 사용했습니다

초당 약 48 프레임의 성능을 달성 할 수 있습니다 이는 초당 30 프레임과 매우 유사합니다 GTX 980 GPU와 비슷한 장비의 CPU를 사용합니다 이제 게임 기계를 만드는 당신의 경우, 당신은 HTX 980 GPU와 CPU, 무슨 소리 야? $ 500에서 $ 1,000의 장비 비용 그러나 Coral Dev Board에서는 150 개에 불과합니다

동일한 결과를 얻을 수 있습니다 그래서 이것은 비용과 성능을 말해줍니다 산호 제품의 장점 이제 Dev Board에 대해 조금 더 이야기 해 보겠습니다 대부분의 엔지니어가 엔지니어이기 때문에 그것의 기술적 인 스펙을보고 싶다

내가 조금 지나갈 게 먼저, Dev Board에서 볼 수 있듯이 또는 내 손에, 그것은 프로토 타입 개발 보드입니다 온보드 기기를 직접 개발할 수 있습니다 응용 프로그램에서 학습 기능 그것은 완전한 컴퓨터입니다 그것은 CPU를 가지고 있습니다

그것은 GPU를 가지고 있습니다 온라인 메모리가 있으며 Linux 운영 체제도 실행합니다 시스템에 연결하십시오 그것은 모듈 형 디자인을 사용합니다 – 우리가 SOM이라고 부르는 것은 무엇입니까? SOM– 시스템 모듈 설계, 다시 말하면, 이 SOM 회로 기판을 스냅 할 수 있습니다 귀하의 제품에 배치하십시오

모듈 디자인을 통해 프로토 타입에서 배포까지 더 쉽게 수행 할 수 있습니다 그것은 당신에게 많은 I / O 커넥터를 허용합니다 개발 도중 많은 액세서리에 연결하려면, 모든 것을 정말 쉽습니다 Dev Board의 사진이 있습니다 보시다시피, 필요한 모든 I / O 포트가 포함되어 있습니다

HDMI와 같은 두 장치를 연결하려면 디스플레이에 연결; 연결할 USB 커넥터 카메라, 키보드, 모니터 등 이더넷 커넥터는 물론 또한 물론 Wi-Fi와 블루투스가 연결되어 있습니다 Wi-Fi를 통해 인터넷에 연결됩니다 승인

약간의 기술 사양에 대해 자세히 이야기합시다 CPU는 CPU 칩에 NXP 쿼드 코어를 사용합니다 보시다시피 제품은 매우 빠릅니다 853은 초고속 CPU 칩입니다 또한 GPU도 지원했습니다

그리고 온보드 암호화 칩을 가지고 있으며, Google 클라우드에 안전하게 연결할 수 있습니다 그것은 1 기가의 온보드 RAM과 8 기가 플래시 메모리를 가지고 있습니다 응용 프로그램을 배포 할 수있는 충분한 공간 그것은 Wi-Fi, 블루투스를 지원하며, 5 볼트 표준 전원 공급 장치 커넥터 측면에서 보면 USB 2

0 및 USB 30 속도 연결을 지원하며 USB Type C 및 유형 A 커넥터 오디오 및 비디오 카테고리에서 볼 수 있듯이, 그것은 모든 AV 연결을 지원합니다 특히 풀 1080p 비디오 디스플레이 용 풀 사이즈 HDMI 20 커넥터

그것은 마이크로 SD 카드를 가지고있어 더 많은 소프트웨어를 내장 할 수 있습니다 기가비트 네트워크를 지원합니다 또한 I / O 연결을위한 GPIO 40 핀이 있습니다 데비안 리눅스의 특별한 버전을 지원합니다 우리는 Mendel을 Edge TPU를 지원하기 위해 전문화했기 때문에 호출해야합니까? 기능

그리고 기계 학습 모델은 대부분의 일반적인 비전 머신 학습 모델 지원 MobileNet, Inception과 같은 소형 장치, 모바일 장치에서 효과적입니다 특히이 GPIO 연결에 대해 이야기하고 싶습니다 제작자 인 여러분 중 상당수는 Raspberry Pi를 사용하여 프로젝트를 만드는 데 익숙합니다 Raspberry Pi에는이 40-ping GPIO 커넥터가 있습니다 개발자위원회 – 데브 보드 – 당신은 똑같은 일을 할 수 있습니다

Raspberry Pi 40-ping GPIO와 호환됩니다 그래서 과거에 해왔 던 모든 일을 위해 외부 조명, 스위치에 연결, GPIO 포트 사용, 포스트 폭 변조를 사용하여 제어 단계 모터, 과거에 라스베리 파이로 한 모든 일, 당신은 아주 쉽게 Dev Board와 함께 할 수 있습니다 그렇다면 Dev Board를 어떻게 사용합니까? 개발 및 배포 내가 설명했듯이 개념적으로는 매우 쉽습니다 이미 이걸 보셨 겠지 프로토 타입을 작성하면 개발 보드를 사용합니다

이 모든 커넥터를 활성화하십시오 스위치, 센서, 온도 게이지, 네가 원한다면 모니터에 연결할 수 있습니다 키보드에 연결할 수 있습니다 당신은 바로 거기에서 개발을합니다

왜냐하면 그 운영체제 장치에서 울립니다 끝나면 SOM 모듈을 벗겨냅니다 Dev Board에서 플러그를 뽑습니다 그리고 내가 말했듯이 많은 SOM 모듈을 구입할 수 있습니다 권리? SOM 모듈을 어떤 제품에도 배치 할 수 있습니다

당신은 말하자면 똑똑한 냉장고, 똑똑한 세탁기 개발하는 응용 프로그램에 따라 다릅니다 그래서 이것은 정말로 쉽습니다 제품 패키지의 프로토 타이핑 및 배포에 사용됩니다 승인? 괜찮아

우리는 개발위원회에 대해 이야기했습니다 두 번째 제품에 대해서도 간단히 설명하겠습니다 이것은 Coral USB Accelerator입니다 이 작은 일이 여기에 있습니다 다시 말하지만, 작은 USB 키가 있습니다

모든 Linux 컴퓨터의 USB 슬롯에 연결하십시오 그것은 온보드 Edge TPU를 가지고 있으며, 기계 학습 기능을 가지고 있습니다 플러그를 꽂은 모든 기기에서 바로 사용할 수 있습니다 또한 데비안 리눅스뿐만 아니라 리눅스도 지원합니다 비슷한 라스베리 리눅스 또는 라즈베리 파이 (Raspberry Pi)에 사용 된 방식과 동일합니다

그래서 이것을 연결하고이 키를 사용할 수 있습니다 그리고 Raspberry Pi와 함께 작업하십시오 그래서 더 많은 기회를 열어줍니다 당신이 개발을하기 위해 따라서 Coral Accelerator의 이점, 1 위, 당신이 상상할 수있는 것처럼, 기계 학습 더 많은 기계로 원하는 경우 랩톱에 연결할 수 있습니다

랩탑이 특별판의 리눅스를 실행한다면 그리고 라스베리 파이 (Raspberry Pi)에 연결할 수 있습니다 많은 하드웨어와 호환됩니다 과거에 라스베리 파이가 지원 한 것 그래서 PC뿐만 아니라 랩톱, Raspberry Pi, 산업 시스템

[INAUDIBLE] 상자는 USB 플러그를 지원합니다 이 키만 꽂으면됩니다 귀하의 기계 학습 응용 프로그램을 배포 할 수 있어야합니다 따라서 Coral USB Accelerator는 저렴한 비용으로 편리한 방법입니다 AR에 프로토 타입을 제작하는 실험

승인 그래서 우리는 하드웨어에 대해 이야기했습니다 소프트웨어 측면에 대해서도 이야기하겠습니다 Coral의 툴체인 전체 제품군 당신이 기계 학습을 할 수있게 해줍니다 응용 프로그램

따라서 소프트웨어 구성 요소를 살펴 보겠습니다 구성 요소 수준에서 산호 소프트웨어 조각 하드웨어가 함께 작동합니다 그래서 Coral Dev Board에서는 리눅스뿐만 아니라 기계, 원한다면, 그리고 맨 아래 층 당신은 하드웨어를 가지고 있습니다 그리고 멘델 리눅스는 그 위에 움직이고 있습니다 그들은 운영 체제와 대화하고 하드웨어와 대화합니다

그리고 Coral, 우리는 C / C ++ 라이브러리 API 직접 액세스를 개발했습니다 운영 체제 및 하드웨어 이렇게하면 직접 액세스 할 수 있습니다 운영 체제가되는 모든 것 당신을 통제 할 수 있습니다 기계 학습 모델이 있다고 가정 해 봅시다 TensorFlow 모델입니다

TensorFlow Lite 모델 우리는 Edge TPU 컴파일러를 제공하여 컴파일, 컴파일 된 TensorFlow Lite 모델 가져 오기 Edge TPU와 호환되는 이진 형식으로 변환합니다 따라서 애플리케이션이있는 경우 C / C + API에 액세스 할 수 있습니다 장치에서 기계 학습 모델을 바로 실행 하드웨어 레이어에 액세스 할 수 있습니다 그러나 우리는 많은 기계 학습 프로그래머는 당신처럼 파이썬을 사용하고 있습니다

따라서 Coral 소프트웨어는 Python 라이브러리 또는 Python SDK도 제공합니다 그것은 당신을 허용 높은 수준의 래퍼입니다 Python 프로그래밍 언어를 사용하여 쉽게 액세스 내가 방금 이야기 한 모든 기능, 기계 학습 모델에 액세스 할 수 있어야합니다 하드웨어에 액세스 할 수 있어야합니다 그리고 파이썬 코드를 I / O 컨트롤 등에 작성할 수 있습니다 그래서 이것은 완전한 환경입니다

함께 작동하는 여러 구성 요소로 우리가 당신을 위해 제품에 넣은 AI 개발을 가능하게합니다 그래서 파이썬 API는 매우 간단합니다 파이썬으로 프로그래밍 한 많은 사람들에게, 우리는 Coral 웹 사이트에서이를 게시합니다 모든 Python API의 기본 클래스 기계 학습을 개발하는 데 사용할 수있는 응용 프로그램 나는 중간 2에주의를 기울일 것이라고 말할 것이다

그것들은 아마도 당신이 가장 많이 사용할 것입니다 하나는 객체 감지입니다 하나는 객체 분류입니다 그리고 그들을위한 기본 엔진 기본 클래스 분류 엔진 (classification engine)이라고 불리는 것이고, 하나는 탐지 엔진이라고합니다 그래서 매우 간단합니다

여기서 마지막으로 본 것은, 우리가 각인이라고 부르는 것입니다 엔진, 그것은 이동 학습을위한 무언가이다, 나는 몇 분 안에 이야기 할거야 이것은 당신이 효율적으로 개발할 수있는 것입니다 파이썬 API 라이브러리의 맞춤형 기계 학습 모델 우리가 제공했습니다 그것도 지원합니다

이제 예제를 간략하게 살펴 보겠습니다 실제로 어떻게 파이썬 코드를 사용하겠습니까? 기계 학습 모듈과 상호 작용하는 모델 우리가 공급하는거야? 그래서 내가 객체를 사용하여 프로그램을 개발하고 싶다면 탐지 모델, 파이썬 코드에서 단순히 엔진을 초기화 할 것입니다 그 기본 클래스 인 DetectionEngine을 사용합니다 그룹 구성원의 기본 클래스, 구성원 함수, 당신은 데이터를 사용하고 시작하고 이야기하기 시작합니다 기계 학습 모듈로 그래서 여기서 엔진을 시작하십시오

또한 소위 레이블 파일을로드해야합니다 왜냐하면 당신이 많은 수의 물체들을 탐지하기를 원한다면, 당신은 라벨로 그것들을 식별하고 싶습니다 레이블 파일을로드합니다 그리고 당신이 기계 학습을 먹이기를 원한다고 가정 해 봅시다 모델 – 개체 감지 모델 – Image를 사용하여 이미지로드 파일

그리고 물론, 대부분의 사람들은 Vision에서 기계 학습 모델을 사용 해왔다 당신은 사진 속의 물건을 식별 할 수 있다는 것을 알고 있습니다 또는 비디오 화면에서 객체를 식별 할 수 있습니다 이 경우, 그것은 텐서의 벡터가됩니다 하지만 여기서 저는 이미지를 사용하는 간단한 예제를 사용하고 있습니다

그리고 기계 학습 모델과 상호 작용하는 코드 매우 간단합니다 간단한 선 엔진에서, 회원 클래스, 당신은 단지 이미지와 함께 감지 말한다 그리고이 이미지에 매개 변수를 전달합니다 반환 된 결과는 대답이 돌아 왔습니다

이 호출에서 테두리 상자를 그리는 것과 같이 사용할 수 있습니다 색상을 지정하고, 바인딩 상자를 그립니다 당신이 탐지하고 있습니다 그래서 매우 간단합니다 우리는 사용할 수있는 기계 학습 모델 그룹을 제공합니다

산호초는 제품에 포함됩니다 우리는 그들을 웹 사이트에 올려 놓습니다 무료로 다운로드 할 수 있습니다 미리 컴파일 된 TensorFlow Lite 모델이 있습니다 당신이 사용할 수 있습니다

더 이상 컴파일하지 않고도 쉽게 실행할 수 있습니다 그리고 하드웨어에 다운로드하기 만하면됩니다 Edge TPU 모듈 – 파이썬 모듈 – 이미 있습니다 Deb Board에 설치되었습니다 따라서 아무 것도 할 필요가 없습니다

이제 Python 프로그래밍 코드를 사용할 준비가되었습니다 방금 전 보여준 예가 그 것입니다 그러나 USB를 사용하는 경우 리눅스 머신을 사용하고 싶습니다 이 Python 모듈을 수동으로 설치해야합니다 앞서 언급 한 것처럼 Python API가 사전 설치되어 있습니다

권리 그래서 그것이 당신이해야 할 일입니다 나는 그런 많은 모델들에 대해서 언급하고 싶다 우리는 당신이 사용할 수 있도록 무료로 온라인으로 공급합니다 – 이들은 비상업적 용도로만 사용됩니다 즉, 모델을 만들고 싶다면, 돈을 위해 팔고 싶다고 가정 해 봅시다

그러면 자신 만의 모델을 만들어야합니다 오픈 소스 무료 모델을 사용하는 대신 비상업적 용도입니다 승인? 제공된 모델에는 앞서 언급 한 범주가 포함되어 있습니다 이미지 분류, 물체 감지, 체중 감기라고하는 것뿐만 아니라 그것은 다시, 양도 학습을위한 것입니다 그리고 저는 그것에 대해 잠시 후에 이야기 할 것입니다

그래서 여기에 모델의 몇 가지 예가 있습니다 온라인으로 사용할 수있게하십시오 그리고 여기에 이미지 분류 모델이 있습니다 보시다시피 우리는 거의 모든 인기있는 이미지 분류를 지원합니다

MobileNet에서 시작까지의 모델 그리고 다른 버전의 MobileNet, 다양한 버전의 Inception 그들 사이의 차이점은 유형 그들이 식별 할 수있는 객체의 예를 들어, 응용 프로그램을 개발하려는 경우 다른 새들의 차이점을 말하기 또는 다른 식물을 선택하면 해당 모델을 선택하게됩니다 쓰다 승인 그걸로 두 가지 데모를 드리겠습니다

첫 번째 데모 개체 감지 모델을 보여 드리겠습니다 그리고 두 번째 데모는 내가 너에게 보여줄거야 객체 분류 모델입니다 그래서 비디오 제작자는 디스플레이를 전환하십시오 여기 카메라에

그래서 여기 테이블에, 당신이 볼 수 있듯이, 이 컨베이어 벨트로이 데모를 만들었습니다 나는 실시간 교통을 시뮬레이션하고있다 여기 카메라가 그것을 가리키고 있습니다 화면에서 볼 수 있듯이 카메라 이 산호초 개발위원회에 들어갑니다 실시간으로 그것은 객체의 수를 식별합니다

그것은 차임을 보여줍니다 그것은 또한 소위 신뢰 점수를 보여줍니다 – 모델이 자동차라고 얼마나 자신 있다고 생각합니다 그러나 컨베이어 벨트 위에서 볼 수 있듯이, 나는 또한 사람이나 보행자가 있습니다 하지만 지금 내가 할 일은 내가 "윙크" 이 영화를 만들어라 승인

그래서 나는 권력을 켤 것입니다 그리고 나는 그것을 달릴 수있는 속도를 올릴 것입니다 이제 실시간 세계에서,이 움직이는 것처럼, 너는 화면을 보았다 기계 학습 객체 탐지 끊임없이 일어나고 있습니다 그것은 계속해서 올바른 자동차 또는 보행자를 식별하며, 또는 교통 신호등도 있습니다

권리? 산호의 성능을 볼 수 있습니다 장면이 진행됨에 따라 매우 높을 수 있습니다 이제 왼쪽 하단에주의를 기울여주세요 화면 또는 화면의 왼쪽 상단 모서리에있는 초당 프레임 속도를 보여줍니다 지난 번에 50을 보았다

초당 70 프레임 매우 빠른 성능입니다 자, 제가 속도를 조금 더 빨리 가도록 크랭크 업 시키면, 당신은 용어로 기계 학습을 볼 수 있습니다 객체 식별 캡처의 작업이 아직 진행 중입니다 권리? 자동차를 계속 식별 할 수 있습니다

이 빠르게 움직이는 환경에서 그래서 이것은 실제로 힘을 보여주는 것입니다 이 산호 장치에서 바로 실행중인 개체 탐지 승인? 이것이 첫 번째 데모입니다 [박수 갈채] 고맙습니다 예, 박수 갈 수 있습니다 너희들이 훨씬 더 재미있게 지낼 수 있기를 바란다

응용 프로그램을 산호초의 힘을 당신의 상상력으로 가져 오십시오 당신의 혁신에 괜찮아 다음은 객체 분류를 보여줍니다

그래서 여기에 다른 데브 보드가 있습니다 그리고 그 결과 – 디스플레이에서이 카메라의 출력으로 전환하십시오 그래서 내가 할 일은 몇 가지 음식 품목이 있습니다 책상 위에 이 카메라가 다른 유형을 식별하게 할 것입니다

개체의 여기에 햄버거를 넣으라고합시다 그리고 왼쪽 상단 구석에서 볼 수 있듯이, 그것은 어떤 신뢰 점수로 물체를 식별하려고합니다 조명 조건에 따라 다르지만, 잘하면 햄버거를 볼 수 있습니다 네 당신은 빛과 함께 올바른 각도로 조준해야합니다

이 도넛을 시험해 봅시다 도넛 말인가요? 그것은 도넛으로 나타 났습니까? 승인 우리는 샌드위치를 ​​시험해 볼 수도 있습니다 승인? 마지막으로, 나는 이국적인 것을 시도 할 것이다 초밥을 가정 해 봅시다

승인 그래서 이것은 당신이 객체 분류 작업을 할 수있는 방법입니다 단순히 객체 분류 모델 중 하나를 실행함으로써 오른쪽 장치에 다시 말하지만, 이들 중 어느 것도 인터넷에 연결되어 있지 않습니다 어떤 데이터도 클라우드 나 서버로 전송되지 않습니다

모든 장치에서 경쟁이 일어나고 있습니다 승인? 큰 고맙습니다 [박수 갈채] 괜찮아 슬라이드로 다시 전환하십시오

이제 우리는 어떻게 사용하는지에 대해 이야기합니다 Coral은이를 구현하기 위해 미리 컴파일 된 모델을 제공했습니다 그러나 당신 스스로 뭔가를 만들고 싶다면 어떻게해야할까요? 모델을 사용자 정의하고자합니다 글쎄, 여기가 전송 학습이 들어오는 곳입니다 전송 학습, 시간 절약에 도움이됩니다

자신의 모델을 구축하는 측면에서 그리고 기본적으로 사전 훈련 된 모델을 필요로합니다 Edge TPU와 호환됩니다 그리고 당신은 당신의 관련 업무에 대해서만 그것을 취합니다 사용자 지정 데이터를 사용하여 개념에서, 신경 네트워크는 뉴런의 깊은 층

승인? 이 전체 모델을 훈련시키고 싶다면 – 사실, 나는 내 동료 중 한 명에게서 그것을 들었다 지상에서 위로 모델을 개발 한 사람 비전 모델을 교육하기 위해 4,000 개 이상의 GPU가 필요합니다 그리고 며칠이 걸립니다 그러나, 모든 것을 훈련하는 대신에, 상단 레이어 만 수정하면됩니다 이것이 이전 학습 개념입니다

하위 레이어 때문에, 그 뉴런 말하자면, 서로 다른 색깔을 감지하려하고 있습니다 다른 모양, 다른 조명 조건 사물을 식별하는 데 도움이 될 수 있습니다 네가 신경 쓰는거야 모델 식별 정보를 작성한다고 가정 해 보겠습니다

다른 사과 전체 모델을 교육 할 필요는 없습니다 당신은 분류 모델을 취하고, 상위 계층 만 수정합니다 사용자 정의 된 데이터로 교육 많은 다른 사과와 그래서 이것은 전학 학습이하는 것입니다

그래서 코드를 전송 학습도 할 Coral의 Python 환경에서 매우 간단합니다 기본적으로, 당신은 이전 학습을 준비하고, Docker 컨테이너를 설정합니다 사용할 모델을 지정하십시오 이 경우 예를 보여 드리겠습니다 나는 MobileNet 버전 1을 사용하고있다

그리고 몇 가지 최상위 레이어를 훈련시키려는 경우, 당신이 사용하기를 원하는 단일 명령 – 훈련을 시작하십시오 그리고 다시, 당신은 매개 변수를 제공합니다 모델명으로 그러나 전체 모델을 교육하려는 경우, 너는 그것도 할 수있다 하나 더 추가 하는가? 추가 플래그, 교육, 전체 모델, 플래그 참된

따라서 일단 시스템의 콘솔에서이 코드를 실행하면, 기본적으로, 콘솔은 당신에게 보여줄 것입니다 취할 단계별 교육 진행 얼마나 많은 시간이 걸리는지의 관점에서 말입니다 그래서 당신이하는 것은 매우 간단합니다 그것은 환경에서 – 리눅스 환경에서 그래서 그걸로 당신을 위해 또 다른 데모를 해봅시다

이것을 가르 칠 수있는 기계라고합니다 우리는 이것을 오픈 소스로 게시 할 것입니다 가까운 장래에 같은 일을 할 수 있습니다 근데 기본적으로 네가 여기 보이는 것을 너에게 보여줄거야 나는 그것을 기억하는 기계를 만드는 법을 가르 칠 것입니다

그래서 비디오 카메라, 비디오 그래퍼, 우리 이 이미지가 있어야합니다 그래서 여기 책상에서 당신이 보는 것, 실제로 그것은 기반으로 만들어졌습니다 이 USB에 Raspberry Pi가 있습니다 그래서 Dev Board보다 더 많이, Raspberry Pi를 사용할 수 있습니다 응용 프로그램을 빌드합니다

여기에 데모가 조금 있습니다 카메라가 있습니다 포인트 그리고 나는 다른 대상을 가지고 있습니다 그래서 내가 버튼을 눌러서 가져 가면 – 내가 버튼을 칠 때마다, 그것은 찍고 이미지를 찍는다

이 햄버거 중 몇 가지 이미지를 기억합니다 이 햄버거의 이제 내가 다른 물건을 가져 가면 제 2 물체의 다른 그룹의 사진, 그것은 이미지를 기억합니다 녹색 버튼으로 아이스크림을 먹을거야 그리고 마지막으로, 빨간색 버튼으로이 도넛을 먹을 것입니다

여기서 백그라운드에서 어떤 일이 일어나는지, 이 프로그램은 전송 학습을 수행하며, 기존의 객체 분류 모델, 마지막 레이어를 방금 찍은 이미지로 바꿉니다 이제 이것을 보아라 이 햄버거를 다시 넣으면 황색 불이 들어옵니다 그것은 기억한다 아이스크림을 넣으면 녹색 표시등이 켜집니다

나는 당신이 비디오에서 볼 수 있기를 바랍니다 예 이 도넛을 가져 가면 푸른 빛이 켜집니다 이제 그 이상 잠시 전에, 나는이 녹색 아이스크림으로 훈련을했다

권리? 녹색 불빛 노란색 아이스크림을 넣으면 기억합니다 그것은 단순히 색상 이상으로 모델을 학습하는 기계이기 때문에, 또한 모양을 식별합니다 이 모양과 모양이 다르기 때문에, 모델은 더 빠르고, 똑똑하다 개체 사이의 차이를 알 수 있습니다

다시 한번 이것은 하나의 예제입니다 당신은 능력으로 물건을 만드는 데 사용할 수 있습니다 인터넷없이 장치에 분류 권리의, 그런 작은 USB 키로도 제작할 수 있습니다 권리? 아주 강력한 것들 [박수 갈채] 고맙습니다

승인 슬라이드로 다시 전환하십시오 그래서 이것의 결과는 엄청납니다 권리? 산업 환경에서 상상해보십시오 당신은 사물을 식별하고 싶습니다

좋은 위젯을 조립할 때 나쁜 위젯으로부터 알리고 싶다 예를 들어, 라인 조립 라인을 훈련 할 시간이 없습니다 자동 분류 기계 전송 학습을 사용하고 다른 객체를 배울 수 있습니다

즉석에서 그래서 매우 강력합니다 애플리케이션을 끝없이 구축하는 데 사용할 수 있습니다 그러한 능력을 사용한다 괜찮아

그래서 우리는 이전 학습에 대해서 이야기합니다 사용자 정의 된 모델을 작성하는 방법에 대해 설명합니다 방법에 대해 좀 더 자세히 설명해 드리겠습니다 산호 모델을 사용하십니까? 승인 그래서 우리는 미리 컴파일 된 모델 세트를 제공했다

너를 위해서 이것은 실제로 사건 번호 1입니다 사용자 케이스 번호 1 매우 간단합니다 우리가 제공하는 산호 모델을 다운로드하면됩니다

다시 컴파일 할 필요가 없습니다 장치를 다운로드하여 설치하면됩니다 승인 두 번째 시나리오는 기존의 모델, 미리 훈련 된 그러나 사용자 정의 전송 학습을 사용합니다

자신의 데이터로 그러나 작업을 완료 한 후에는 아직 호환되지 않습니다 산호 널과 당신은 컴파일해야합니다 산호가 제공하는 산호 컴파일러를 사용합니다 그리고 그것을 컴파일합니다

TensorFlow Lite 파일의 최종 결과입니다 Edge TPU Coral 하드웨어에 다운로드합니다 그리고 거기에서 도망 갈 수 있습니다 이제 저는 지금 당장 코랄 컴파일러에 대해 말하고 싶습니다 Google Cloud Platform에서만 실행됩니다

그러나 곧 우리는이 컴파일러를 만들 것입니다 독립 실행 형 실행 파일, 다운로드 가능 인터넷에 당신을 위해 사용할 수 있습니다 따라서 사용자 사례를 구축하고 싶습니다 너 자신에 의해 전체 모듈 이것은 사용자 정의가 실제로 필요한 것입니다

기존 모델이 당신을 만족시키지 못한다 당신도 그렇게 할 수 있습니다 그래서이 경우에, 당신은 필요할 것입니다 – TensorFlow로 시작하여 거기에서 모델을 구축하십시오 그럼 저와 관련된 단계에 대해 이야기하겠습니다 나만의 맞춤형 모델을 만드는 워크 플로 다음과 같습니다

TensorFlow 모델은 모두 아시다시피, 그것은 32 비트 부동 소수점 모델입니다 권리? 그리고 지금은 산호초에서 사용할 수 있습니다 Coral 장치는 TensorFlow Lite가 필요하기 때문에 Edge에서 실행되며 메모리가 거의 필요하지 않습니다 따라서 TensorFlow 모델이 효과적입니다 TensorFlow 모델을 선택하십시오

당신은 그것을 1 단계로 변환합니다 당신은 양자화 된 버전으로 훈련으로 변환합니다 그래서 교육 과정이 있습니다 양자화 – 인식 훈련 TensorFlow 모델을 변환합니다

양자화 된 TensorFlow 모델로 변환합니다 그래서 기본적으로 32 비트 부동 소수점을 변환합니다 8 비트 정수 기반 모델을 기반으로합니다 그런 다음 TensorFlow 모델을 사용하여이 모델을 내 보냅니다 일반적으로

pb PDF 인 TensorFlow 고정 그래프로 파일 그러나이 파일도 사용할 수 없습니다 산호에 배치 할 준비가되지 않았습니다 다음 단계는 당신이해야 할 일입니다 이 제품을 TensorFlow Lite 모델로 변환해야합니다

TensorFlow Lite 변환기가 포함되어 있습니다 그리고 나서 TensorFlow Edge TPU를 사용하여 컴파일합니다 TensorFlow 컴파일러와 바이너리 만들기 Edge TPU와 호환됩니다 그런 다음 작업을 수행 한 후에 배포합니다 이 과정은 당신의 흐름입니다

귀하의 환경에서 사용할 것입니다 구축을 위해이 플랫폼이 어떻게 당신에게 제공되는지에 대해 이야기합니다 응용 프로그램 작성 우리는 아주 처음에 우리가 원하는 산호초가 생태계의 기반 모두 함께 그래서 이것은 정말로 당신을위한 플랫폼입니다 세계적으로 지역 사회와 혁신하고 공유하는 데 사용 전부

그걸로 저는 여러분에게 하나의 예를 보여주고 싶습니다 당사의 소매 파트너 중 Gravity Link 그들은이 앱을 만들었습니다 매우 멋진 앱 휴대 전화를 사용하여 앱을 직접 다운로드 할 수 있습니다

산호초 개발위원회에 그리고 아래 링크에서 자세한 내용을 확인할 수 있습니다 또는 Google Play에서 Model Play를 검색하기 만하면됩니다 다운로드하여 시도 할 수 있습니다 이것이 우리가 모든 개발자가 기여하고자하는 아이디어입니다

이 생태계, 건물 도구, 건물 모델, 응용 프로그램 작성, 업계와 공유 그리고 이것은 산호 생태계가 지향하는 것입니다 그걸로 끝내자 AI에서 개발할 수있는 잠재적 인 영역은 무엇입니까? 이것 좀봐 물론 가전 제품이 있습니다 기구; 거기에서 개발할 수있는 많은 기회가 있습니다

산업용 창고, 장치의 모니터링, 조립 라인을 모니터링합니다 이것은 또 다른 영역입니다 로봇 로보틱스 업계와 소비자 모두 현장입니다

자동차 자동차 산업 또한 분야입니다 그리고 Google I / O 기조 연설에서 여러분 모두와 같이, 의료 기기, 의료 기기 등이 또 다른 분야입니다 그리고 마지막으로 교육 교육 보조 및 연구

기계 학습 – 기기 기반 기계 학습을 사용할 수 있습니다 당신이 혁신 할 수있는 산호를 사용합니다 그래서 할 수있는 일이 많이 있습니다 권리? 그리고 내가 오늘 이야기 한 모든 정보, 그들은 산호 웹 사이트에 요약되어 있습니다 기억이 안나면 이것을 기억하십시오

CoralwithGooglecom이라고합니다 우리의 문서, 샘플, 모델, 모든 것이 있습니다 그래서 슬라이드에 더 많은 참고 자료가 있습니다

당신은 나중에 볼 수 있습니다 Mendel Linux에 대한 참조가 있습니다 TensorFlow Lite에 대해 어떻게 할 수 있습니까? 양자화 인식 교육을 수행합니다 그리고이 모든 정보는 매우 중요합니다 Stack Overflow에서 태그가 있습니다

온라인 커뮤니티에 가입 할 수 있습니다 토론에 참여하고 대답하다 다른 개발자의 질문 또는 답변을 살펴보십시오 너를 감시하거나 서로 돕고 싶다 이 온라인 커뮤니티를 사용합니다

그리고 큰 소리로 말하고 싶습니다 우리는 당신을 위해 산호초 코드 응용 프로그램을 가지고 있습니다 I / O에서 Coral을 사용하여 실험하고 싶습니다 오늘 거기에 갈 수 있습니다 Dev Load 팀 동료는 모두를 돕고 있습니다

코딩 앱으로 간다 즉, 요약 및 행동 강령입니다 오늘 여기 와서, 번호 하나 산호 제품을 검토하십시오 TensorFlow Lite에 대해 자세히 알아보십시오

산호 보드를 사용하여 실험하기 그리고 나만의 맞춤형 모델을 구축하십시오 그리고 마지막으로, 지상에서 위로 모델을 구축하십시오 우리는 산호 플랫폼을 복용하기를 원합니다 당신의 상상력을 넣고, 혁신을 넣고, AI를 업계 곳곳의 소비자에게 제공하십시오

그래서 우리 산호 팀을 대표하여, 이 세션에 참석해 주셔서 대단히 감사합니다 고맙습니다 [음악 재생]

Document Understanding AI on Google Cloud (Cloud Next '19)

SUDHERRA VANGURI : 기업 데이터의 80 % 크게 비 구조화되고 70 % 그 중 많은 부분이 자유 형식 텍스트 형식입니다 자유 형식 텍스트를 사용하면 많은 기업을 볼 수 있습니다

어두운 데이터에 앉아 그리고이 데이터는 문서 금광이 될 수 있습니다 이 문서들은 PDF, 이메일, 계약서, 의견, 트윗, 티켓, 특허 파일, 신청 양식 그리고이 데이터는 점점 커질 것입니다 우리는 많은 조직 구조화되지 않은 데이터의 영역을 이해할 필요가 있습니다

그리고 이미 조직에 있다면 이 문제를 알고 있고 노력하고 있습니다 비즈니스의 일부로 이러한 문서를 분석하는 방법 워크 플로, 지출 가능성이 높습니다 많은 시간과 돈과 자원 이러한 문서를 분석합니다 또한이 프로세스는 오류가 발생하기 쉽습니다 우리가 문서를 이해한다고 말하면 어떨까요? 인생을 더 쉽게 만들어주는 솔루션 은행을 깨지 않고? 안녕 모두, 내 이름은 Sudherra Vanguri, 저는 Document Understanding AI의 제품 관리자입니다

여기 Google Cloud에서 오늘 나는 당신을 빠른 개요를 통해 안내 할 것입니다 솔루션의 나는 해결책을 조금 풀어 내려고 노력할 것이다 무슨 일이 일어나는지 조금 깊이 잠수해라 솔루션 및 솔루션 구성 요소

또한 흥미로운 파트너 통합도 있습니다 나와 이야기 할 이야기가 있다면 [INAUDIBLE] 님의 무대에서 합류 할 수도 있습니다 아이언 마운틴 (Iron Mountain)의 제품 관리 이사 그리고 그녀는 4 가지 주요 사건에 대해 이야기 할 것입니다 아이언 마운틴의 연구 및 수직 솔루션 에 투자

또한 고객 엔지니어 인 밀란 리 (Milan Lee) 특허 출원의 데모를 통해 우리를 걸을 것입니다 비정형 데이터에서 종단 간 처리되었습니다 문서 이해 AI를 사용하여 구조화 된 데이터로 변환합니다 시작하자 따라서 문서 이해 AI는 해결책입니다

주요 문서 처리 작업 흐름을 자동화 할 수 있습니다 그 문서들 속에서 귀중한 지식을 추출하십시오 어떻게해야합니까? 글쎄, AI를 이해하는 문서는 우리의 강력한 자연어에 힘 입어 능력, 지식 능력 및 비전 OCR 기능 그래서 솔루션을 분리하고 살펴 봅니다 조금

GCP 또는 파트너 솔루션에 참여할 수 있습니다 구조화되지 않은 데이터 형태, 패턴, 계약, 그 모든 문서 금광은 우리가 오래 전 언급했다 Google은 귀하가 해당 문서를 분류 할 수있게하며, 그 문서를 의미있게 사용하여 조직하십시오 우리의 AutoML 기술 또한 주요 가치 쌍 및 엔티티를 추출 할 수 있습니다

그 문서들에서 다시 말하지만, 국가 언어, 비전 OCR, AutoML 기능 비즈니스가 자신의 스키마를 추가하는 경우, 우리는 또한 지식 능력을 가지고있다 지식 서비스라는 새로운 알파 버전을 통해 이를 통해 지식 그래프를 구성 할 수 있습니다

귀하의 구조화되지 않은 데이터를 추출하여 귀하의 ERP 시스템에 매핑하십시오 이러한 문서에서 통찰력을 추출 할 수 있습니다 그 비정형 데이터를 구조화 된 데이터로 변환 할 수 있습니다 간단한 데모를 보여 드리겠습니다 발표자 1 :이 데모에서는 지식 기반이 있습니다 다양한 주제에 관한 Wikipedia 기사가 포함되어 있습니다

모두 48 개의 문서가 있습니다 문서 중 하나는 증기 엔진에 관한 것입니다 여기에서는 Wikipedia 기사의 내용을 보았습니다 증기 기관에 관해서 증기 기관에 대해 알고 싶습니다

기본 검색에서 볼 수있는 결과가 있습니다 몇 가지 핵심어에서 일치하지만 의미 상 아닙니다 쿼리와 비슷합니다 우리는 시맨틱 매치로갑니다 응답이 쿼리의 의미와 일치하는 것을 볼 수 있습니다

문서에서 해당 내용을 보면 문서의 어디에 있는지 알 수 있습니다 그 통로가 온다 우리 기사 중 다른 하나는 의사에 관한 것입니다 유명한 영국 TV 쇼 Doctor Who의 음모를 알고 싶다고합시다

그래서 의미 론적으로 비슷한 쿼리를 입력하겠습니다 기본 검색 결과에서 우리는 실제로 닥터 누가 누구인지 확인하십시오 그러나 의미 론적 일치에서, 우리는 훌륭한 묘사로 끝 맺는다 닥터 후 그는 주인공입니다

그는 다른 행성 출신입니다 그리고 그는 The Doctor라는 이름으로갑니다 이제 내가 더 깊이 잠수하고 싶다고 해보자 나는 특정 질문에 답하고 싶다 검색 결과가 좋지 않습니다

우리가 그 질문에 대한 대답을 보는 것 실제로 문서에 있습니다 그리고 그 대답은 826입니다 826 닥터 누가 1963 년부터 분할 우리가 다른 질문을하고 싶다고합시다 언제 처음 공기가 들렸습니까? 그리고 확실하게 대답은 문서에 있습니다

우리는 그것을 찾아 서비스 할 수 있습니다 SUDHERRA VANGURI : 이것이 우리의 지식 능력의 일부입니다 너를 위해서 Google의 맞춤 키 값 쌍이 많다는 것도 알고 있어야합니다 및 맞춤 지식 격투 기능 동일한 사용 사례가 다양한 카테고리에 적용될 수 있습니다

비즈니스 스키마가있는 산업 간단히 말해서, 이해할 수있는 문서는 무엇입니까? 파트너 솔루션을 통해 당신의 문서를 정리할 수 있고, 핵심 가치 쌍 및 통찰력을 분류하고 추출한다 해당 문서 내에서 귀하의 비즈니스를 자동화하십시오 워크 플로는 추출 된 통찰력을 사용합니다 충분히 이야기 해

파트너 솔루션에 대해 자세히 살펴 보도록하겠습니다 초기 출시 일부를 발표했다 파트너, 선두 발사 파트너, Iron Mountain 문서 이해 AI와 완벽하게 통합됩니다 솔루션과 우리의 능력 우리는 또한 중요한 파트너십과 통합을 가지고 있습니다

UiPath, Egnyte, Box, Taulia, DocuSign, Accenture 몇 가지 주요 용도로 들어가자 사례 및 몇 가지 흥미로운 사례가 있습니다 우리의 첫 번째 파트너 인 Egnyte는 문서 이해 AI 파일 다운로드의 비정상적인 활동을 탐지하는 방법 특허, NDA 및 계약 관련 이제 Egnyte Protect는 조직을 활성화합니다 또는 관리자가 중요한 다운로드 시점을 알 수 있습니다

민감한 문서가 발생했습니다 지난 몇 주 동안 그리고 그것은 Egnyte Protect입니다 액세스되는 공통 파일 유형의 개인화 된 프로파일을 빌드합니다 말하자면, 존 스미스

음, 그건 전적으로 가설적인 것입니다 나는 존 스미스에 대해 모른다 미안, 존 스미스 John Smith가 액세스한다고 가정 해 봅시다 많은 특허 파일, 일주일 이내에 250 개의 이상한 패턴 파일

그의 정상적인 프로파일은 전형적으로 2 ~ 3 계약, 4 ~ 5 계약 특허 일주일 동안 이제 문서 이해 AI와 함께, Egnyte Protect는 계약서, 직원 목록, 송장, NDA 및 다양한 문서 민감한 문서 형식 지정 및 플래그 지정 대용량 파일 활동이 발생하면 내부자 공격과 간첩 행위 시도 조직에 의해 방해받을 수 있습니다 멋진 실제 응용 프로그램입니다 문서의 민감한 문서 작업 부하에 대한 AI 이해 우리가 볼 수있는 것은 다양한 산업에 적용됩니다 인사 파일, GDP 준수 확인, 등등

문서 이해 AI의 또 다른 파트너 애플리케이션 문서 이해 AI를 사용하여 양식에 자동 태그 추가 전자 거래 관리 파트너 인 DocuSign은, 경계 상자를 탐지하기 위해 AI (Document Understanding AI)를 사용했습니다 에 양식 여기서 중요한 사용 사례는 W9 양식이라고 가정 해 봅시다 우리는 정확하게 식별 할 수 있습니다 수천 개의 문서에 대해 학습 된 바운딩 박스

또한 해당 테두리 상자를 연결합니다 서명 필드, 명명 된 필드, 확인란, 등등 수동으로 작성된 완전히 태그가없는 문서에서 이동하려면 이전에 완전 자동, DocuSign이 출시 한 태그가 추가 된 양식 모바일 애플리케이션에 통합 할 수 있습니다 나는 너에게 보여주는 멋진 데모가있다 이거 토크 트랙이 없지만 너를 위해 그것을 이해하려고 노력하라

그럼 우리가 농지를 가지고있는 NDA를 가지고 있다고 가정 해 봅시다 5 개 필드 정도의 집합 그리고이 NDA는 한 당사자가 서명해야합니다 보낸 사람, 내일 말하자 이 NDA를 마틴에게 보냅니다

이제 자동 태그 추가가 시작됩니다 문서 이해하기 AI 이해하기 우리는 자동으로 무엇이 날짜 표시인지 식별 ​​할 수 있어야합니다 텍스트 필드, 서명 필드 란 무엇입니까? 이제 우리는 NLP, AutoML, 자연 언어를 사용합니다 그게 전부 야 이전에는 이것이 전적으로 수동 프로세스였습니다

타마라는 어떤 필드에는 서명이 필요합니다 문서 사용하기 AI 이해하기, 우리는 자동으로 서명이 언제인지를 식별 할 수있다 서명 필드 근처, 날짜 기호는 무엇입니까? 필드와 [INAUDIBLE] 날짜의 비교 등이 있습니다 AI, 다양한 기술의 강력한 조합 NLP, OCR 및 AutoML 기술의 결합 또 다른 파트너, UiPath가 사용했습니다 문서화 자동화를위한 AI 이해 그들의 인보이스 프로세스

여기에 인보이스의 예가 나와 있습니다 보시다시피 인보이스는 표 형식입니다 송장에는 많은 필체 텍스트가 있습니다 거기에 우표가 있습니다 따라서 우리는 키 값 쌍을 정확하게 식별 할 수 있습니다

그 송장 내에서 보시다시피, 더 자세히 살펴보면, 우리는 또한 핵심 가치 쌍에 대한 신뢰 점수를 공유합니다 그 송장에서 추출한 자, 루프에 인간이 있다면, 우리는 또한 인간이 자신감을 들여다 볼 수있게했습니다 과정에서 더 많은 하류 처리가있을 수 있습니다 그 송장에 인보이스 처리의 전체 수동 프로세스 문서 이해 AI를 사용하여 완전히 자동화되었습니다 인보이스 처리와 유사한 유스 케이스 문서 이해를 이용한인지 인보이스 우리 파트너 인 Taulia가 통합 한 AI입니다

Taulia는 문서 이해 AI를 사용합니다 송장 데이터 자동 추출 플랫폼, 공급 업체 및 구매자 사용 그곳의 어디서나 송장을 조정할 수있다 확인이 필요합니다 그러나 인보이스 처리의 상당 부분 문서 이해를 사용하여 자동화됩니다 Taulia가 말했듯이, 매뉴얼의 어두운 시대에서 벗어나 UAI를 사용한 송장 처리

최종 파트너 통합은 Accenture Saga, NLP 문서 이해로 구동되는 플랫폼 AI 및 기타 주요 제 3 자 솔루션, 우리의 자본 추출, 지식 그래프 작성, 핵심 질문 답하기를 풀기위한 질문 응답 서비스 문서 이해 워크 플로 Accenture의 고객에게 제공됩니다 그걸로, [INAUDIBLE] 아이언 마운틴 InSight에서의 깊은 다이빙 주요 사례 연구 [? 앙카 :?] 대단히 고마워 내 이름은 [? Anka ?] 저는 제품 관리 이사입니다 Iron Mountain Insight 용

그리고 우리 플랫폼에 대해 조금 이야기 할 것입니다 가치를 창출 할 수있는 유스 케이스 우리 고객을 위해 그래서 사무실 경험과 우리 중 많은 사람들 정보로 작업하고 이것이 무엇인지 알 수 있습니다 엄청난 양의 데이터가 있지만 당신이 그것을 필요로 할 때 옳은 물건은 믿을 수 없을 정도로 아직도 어렵다 그래서이 인용문은 1982 년에 나온 것입니다

좋아, 그거 생각 해봐 그래서 우리는 그것을 고칠 시간이라고 생각합니다 Google과의 파트너십은 그 모든 것입니다 우리 고객은 다양한 단계에 있습니다 디지털 전환은 가치를 창출하기위한 것입니다

그들의 정보에서 새로운 일하는 방식으로, 그리고 솔직히 말해서, 정보의 위험을 줄인다 그들이 저장하고있는 곳 실제로 많은 통계가 있습니다 이미 언급 했잖아, 맞지? 엄청난 양의 저장 공간 실제로 사용되는 정보는 거의 없습니다

Iron Mountain과 결합 된 문서 이해 정보 관리 및 정보 거버넌스 전문 지식을 통해 우리는 한 발을 내딛을 수있었습니다 우리는 규모면에서 그리고 서비스로서, 그 정보 전부에서 가치를 전달하십시오 그리고 다시, 저는 우리가 일종의 정보에서 왔다고 말했습니다 거버넌스 배경 그래서 우리는 또한 적용 가능한 규정을 준수 할 수 있는지 확인하십시오

당신이하는 것처럼 당신에게 그래서 몇 가지 높은 수준의 정보를 간단히 살펴 보겠습니다 플랫폼에 대해 살펴본 다음 사용 사례를 파헤 치십시오 모든 것이 어떻게 작동하는지 보여줍니다 그래서 플랫폼은 실제로, 일종의, 3 단계, 만약 당신이

첫 번째는 섭취입니다 우리에게는 섭취가 매우 광범위합니다 그래서 우리는 우리와 함께 물리적 정보를 저장하는 고객이 있습니다 종이 일 수도 있고 테이프 일 수도 있습니다 우리는 우리가 모든 정보를 플랫폼으로 가져올 수있게하십시오

그것을 풍부하게하고 그것을 처리하기 위해서 디지털 정보 일 수도 있습니다 맞습니까? 그래서 다양한 소스로부터의 섭취, 다양한 형식이나 형식, 다양한 형식으로 제공됩니다 비디오, 이미지, 문서, 모든 다양한 소스 Sudherra는 이전에 언급했다 두 번째 단계는 그 내용을 처리하는 것입니다

우리는 GCP 위에 클라우드 기본 플랫폼을 구축했습니다 그래서 우리는 GCP의 모든 힘을 활용하고 있습니다 정보를 저장하고 처리하기 위해 우리는 문서 이해 AI를 순서대로 사용하고 있습니다 콘텐츠를 분류하고 풍부하게합니다 그리고 실제로 3 가지 기본 사용 사례가 있습니다

높은 수준에서 우리가 운전하고 싶습니다 하나는 분석입니다 이 정보를 사용자에게 가치있게 만드는 방법은 무엇입니까? 두 번째는 정보 거버넌스에 관한 것입니다 이제 내가 가진 것을 알고, 정책은 무엇인가? 신청해야합니까? 얼마나 오래 보관해야합니까? 언제 보호해야합니까? 거기에 개인 정보 나 민감한 정보가 있습니까? 세 번째는 워크 플로우 자동화입니다 그리고 우리는 유스 케이스를 각 항목을 설명합니다

결국 구조를 추가하는 것입니다 콘텐츠의 큰 부분 그것은 오늘날 구조화되지 않은 것입니다 첫 번째 유스 케이스는 석유와 가스에 있습니다 그래서 우리는 믿을 수 없을 정도로 다양한 유형을 저장합니다 우리의 석유 및 가스 고객을위한 것

스캔하여 처리 한 ginormous 맵일 수 있습니다 테이프에있는 지진 데이터 일 수 있습니다 수십에서 수 백 피트가 될 수있는 잘 통나무 일 수 있습니다 긴 그리고 우리는 A를 도와 모든 정보를 수집합니다

그런 다음 문서 이해 AI를 사용하여, 우리는 도움이되는 정보를 추출합니다 우리, 솔직하게, 지구 과학자를 가능하게해라 이 정보를 사용합니다 다양한 콘텐츠가 모두 있으므로 당신이 과학자라면 상상해보십시오 어디에서 평가해야하는지에 대한 정보를 찾으십시오

당신은 교련하고 싶거나 특정 우물의 가치는 무엇인가? 아이언 마운틴 (Iron Mountain)의 종이지도를 살펴 보았습니다 잠재적으로 지진에 대비하여 테이프를 감 으려고합니다 그리고 당면 과제 중 하나는 너는 실제로 접근 할 수 있는지 안다 당신이 필요로하는 모든 것에 여기서 우리가하는 일은 정보 처리입니다

다시 Document Understanding AI를 사용합니다 우리는 또한 정보를 풍부하게 할 수있다 외부 메타 데이터 소스를 사용합니다 따라서 많은 정보 메타 데이터를 가져 오는 것입니다 AI를 사용하는 것에서부터 기존 소스에서부터, 그 모든 것을 함께 시각적 인 검색에 넣습니다

지구 과학자들이 다음과 같은 방식으로 검색 할 수있게 해주는 UI 말이된다 그래서 물건을 찾는 데 시간의 절반을 소비하는 대신, 실제로 분석 할 때 대부분의 시간을 소비 할 수 있습니다 따라서 검색 UI는 위치 별 액세스를 허용합니다 그래서지도에서 특정 지점을 찾고 있다면 내가 평가하고 싶은, 나는 얻을 수있다 나에게 관련있는 정보에 대한 권리 내가 다루고있는 다양한 자산에 걸쳐 우리는 예를 들어 유사성 검색을 사용합니다

그래서 내가 어떤 패턴이나 일종의 침입을 보게되면 그게 나에게 흥미로울 수도있어 유사한 패턴을 가진 모든 애셋을 빠르게 찾을 수 있습니다 그리고 그 모든 것은 정말로 더 빠른 의사 결정에 관한 것입니다 더 나은 분석 두 번째 유스 케이스, 더 많은 텍스트 문서 무거운

이 경우 우리는 모기지를 다루고 있습니다 정말 그 자동화를 가능하게합니다 수동 워크 플로우 우리 모두는이 물건들이 모두 온라인이라고 생각할 것입니다 우리는 그것을 온라인으로 모두 채 웁니다

너는 놀랄거야 그것의 대부분은 라인 어딘가에 종이가됩니다 따라서 매우 무겁고 수동적 인 프로세스입니다 결과적으로, 또한 매우 느린 프로세스입니다 따라서이 특별한 사용 사례는 모두 여러 날에서 여러 시간으로 프로세스를 수행하는 것에 대해 이 특정 사용 사례의 경우 또한 문서 이해 능력을 아주 잘 보여줍니다

일체 포함 여기서 우리가하는 일은 대출 파일을보고있는 것입니다 우리는 두 가지 질문을하고 있습니다 그것은 완전하고 정확한가? 따라서 모기지 잔액이 완전한지 여부를 결정하기 위해, 나는 어떤 서류를 가지고 있는지 이해해야한다 문서를 분류하십시오

위치 별 목록과 비교 실제로 필요한 것 무엇이 완료를 정의합니다 모든 문서가 여기에 있는지 확인하십시오 이제 우리가 파고 들어 정확합니까? 이것이 우리가 정보를 끌어 내야하는 곳입니다

그것이 이름이든, 사회 보장 번호이든 그것은 APR 일 수 있습니다 제비 뽑기와 제비 뽑기와 제비 뽑기가있다 에 걸쳐 발생하는 추출의 그 다른 문서들 그리고 두 가지 하나, 나는 모든 것을 채워야합니까? 서명이 필요한 위치에 서명이 있습니까? 내가 이름을 기대하고있는 이름이 있니? 특정 규제 기관의 도장이 있습니까? 뭔가를 축복해야합니다

모든 것들을 확인해야합니다 그런 다음 문서를 조사해야합니다 동일한 사회 보장 제도를 가진 동일한 이름을 가지고 있습니까? 그들 모두의 숫자? APR은 동일합니까? 그리고 본질적으로 누군가를 틀린 종이를 넣었습니까? 잘못된 파일에 있거나 문서가 잘못 채워져 있습니다 또는 불완전하게? 따라서 문서를 이해하면 이러한 모든 일을 처리하는 데 도움이됩니다 그런 다음 워크 플로 자동화 관점에서 볼 때, RPA 프로세스를 활성화하기 위해 출력 할 수 있습니다

이제는 수동이 아닌 훨씬 더 자동화 될 수 있습니다 그래서 당신이 정상을 생각할 때 이 특별한 슬라이드의 모든 작은 사람들, 그 곳은 항상 시간을 보낸다 이것이 비효율적 인 부분입니다 대기 시간이 고객 경험에서 오는 곳입니다 원근법

괜찮아? 그래서 우리는 여기서 더 나은 고객을 이끌어 내고자합니다 실제 지원자를위한 경험, 프로세서의 시간과 비용을 절감 할 수 있습니다 그리고 마지막으로, 물론 자동화 전체 워크 플로우가 자동으로 종단되도록 할 수 있습니다 정말로 중요한 두 번째 것 일단 우리가이 풍부한 정보를 모두 가지고 있다면, 사용할 수있는 다른 유스 케이스가 있습니다 그래서 모기지 프로세서가 이해하기를 원한다면 그들이 공정한 대출을위한 준수와 관련하여 어떻게하고 있는지, 그들은이 모든 풍부한 정보를 가지고있다

이제 어떻게하는지 이해하는 데 사용할 수 있습니다 그들은 실제로 위치가 좋은가? 아니면 문제가 있습니까? 그리고 그들이 그것에 대해 무엇을 할 수 있습니까? 따라서 위에있는 분석은 일단이 모든 작업을 완료하면, 다른 유스 케이스가 무수히 많다 해당 특정 고객에 대해 활성화 할 수 있습니다 문서 중심의 또 다른 프로세스는 HR입니다 그래서 직원 기록

이 특별한 사용 사례는 개인 정보 보호에 중점을두고 있습니다 그래서 GDPR이 언급되었습니다 개인 정보와 GDPR 준수 정말로 당신이 어디에서 이해할 수 있어야한다는 것을 의미합니다 직원에 대한 개인 정보가 있습니다 이 경우에

그리고 당신은 그것에 빨리 도달 할 수 있어야합니다 직원이 말하길, 이봐, 나는 알고 싶어한다 네가 나에 대해 무엇을 지키고 있는지 어떤 개인 정보를 저장하고 있습니까? 나는 그 내용에 빨리 도달 할 수 있어야합니다 나는 그 모든 것을 발견하고 있는지 확인해야한다

그리고 실제로 그것을 줄 수 있어야합니다 직원이 요청할 경우 직원에게 전달해야합니다 다양한 소스의 문서 처리 다양한 형식으로 제공됩니다 그래서 나는 정말 오랫동안 아이언 마운틴에 있었어 내가 처음 고용되었을 때, 우리는 종이를 채웠다

그래서 제 기록은 아마도 종이에 있습니다 그래서 그 모든 것을 끌어 당기고, 그 내용을 이미지 할 수 있고, 그 콘텐츠가 몇 달 전 또는 전자적으로 수집 된 1 년은 매우 중요합니다 능력을 가질 수있는 능력 문서의 해당 내용 이해하기 내가 실제로 거래하고 있는지 여부입니다 민감한 정보 또는 개인 정보가있는 경우, 그냥, 여기와는 달리, 큰 더미의 물건들이 있습니다 관련성이 없으면 다시 기업이 준수 할뿐만 아니라 효율적으로 대응해야합니다

요청합니다 이런 것들에 대한 다른 점은 더 이상 물건을 오래 보관할 수 없습니까? 그래서 보존 정책 많은 회사들이 오랫동안 디폴트를 취했다 나는 모든 것을 영원히 간직했다 그렇게해서 나는해서는 안되는 것을 삭제하지 않을 것입니다

글쎄, GDPR은 실제로 영원히 보존의 모든 시대를 끝낸다 정책 이제 우리는이 정보를 얻었습니다 우리는 그것을 우리가 이해할 수 있도록 분류했다 누구를위한 것이지, 직원이 회사를 떠날 때, 우리는 실제로 그 정보를 없앨 수 있어야한다

보존 기간 내에 즉, 개인 정보 보호 규정을 준수해야합니다 그래서 내용을 분류하고 이해하고 그 정보는 특정 직원과 관련이있다 또한 필요할 때 정보를 제거 할 수 있습니다 이것이 바로 정책과 AI의 문서 이해 회사가 올바른 일을하도록 돕기 위해 정말로 함께합니다 적시에

다음에 나는 조금 더 파고 들어갈 것입니다 실제로 우리는 고객으로부터 많은 것을 듣습니다 당신이 어떤 회사인지는 중요하지 않습니다 아마도 고객 계약이있을 것입니다 우리 모두는 우리가 많은 것을 원하기를 바랍니까? 아이언 마운틴 (Iron Mountain)에서는 400,000 명이 넘습니다

그래서 아주 간단한 일은 정말로 어려울 때 당신은 물건의 크고 거대한 더미를 가로 질러 그들을하려고 노력하고 있습니다 그렇게 그래서 우선, 그들은 일종의 배포를하는 경향이 있습니다 다른 제품 및 서비스, 지역, 그들이 얻은 다른 인수 그래서 그 물건들이 여기 저기에 있습니다

이렇게 간단하고 간단한 질문은, 이 특정 고객에 대한 모든 계약은 무엇입니까? 벌써 힘들어 사람들은 많은 다른 곳에서 찌르다 그들은 다시, 그들이 희망하기를 바랍니다 모든 관련 정보를 찾지 만 그렇지 않을 수도 있습니다 다른 한 가지는, 음, 누가 비표준 지불 조건이 있습니까? 어떻게 대답하니? 당신은 많은 문서를 읽습니다

그것이 오늘 어떻게 이루어 졌는지입니다 그러면 좀 더 복잡한 질문을 보게됩니다 어떤 계약은 데이터에 대한 책임 한도가 있습니다 1 백만 달러를 넘는 위반? 그리고 지금 우리는 문서 이해를보고 있습니다 정말 강력한 도구 인 인공 지능 자연어 문제를 실제로 허용하도록 대답을 받아라

그래서 우리가 매우 긴밀하게 협력했던이 특별한 사용 사례들 Google과 함께 지식 기능 사용 Sudherra가 이전에 실제로 소개 한 사용자가 이러한 유형의 정보를 매우 쉽게 찾을 수 있도록 도와줍니다 매우 빠르게 그럼 몇 가지 예를 보여 드리겠습니다 UI가 어떻게 보이는지 보여주는 그리고 그 경험은 사용자를위한 것입니다 그래서 이것은 간단합니다, 나는 모든 계약이 필요합니다

주어진 고객 이 경우에 우리는 실제로 영업 사원 다루기 여기에 정말 힘든 또 다른 것 잠재적으로 여러 이해 관계자가 있다는 것입니다 이 콘텐츠에 액세스해야하는 회사 내에서 그리고 우리는 그들 각각을 허용 할 수 있습니다 지금이 풍부한 정보에 액세스 할 수있는 혜택을 누릴 수 있습니다

매우 빠르게 따라서이 특정 사용 사례에서는 파고들에서 사람들에게 물어 보며 본질적으로 한 번의 클릭으로 다른 리포지토리로 이동합니다 우리가 한 일은 우리가 추출, 우리는 당신을면 또는 위젯으로 사용할 수 있습니다 나는 그것들을 나의 UI에 고정 할 수있다 그래서 내가 보통 고객 이름으로 물건을 찾고 있다면, 사실 내 UI에 바로 고정 할 수 있습니다

특정 고객을 찾고 있다면, 이름을 입력하거나 하나를 클릭하십시오 내가 찾는거야 그리고 필요한 모든 문서가 한 번의 클릭으로 있습니다 그렇게 믿을 수 없을만큼 효율적으로 매우 간단한 대답입니다 둘째, 좀 더 복잡합니다

이제 표준이 아닌 지불 조건을 가진 사람은 누구입니까? 이것은 사실 기업들에게는 상당히 일반적인 문제입니다 그리고 그것은 매우 어렵습니다 그래서 다시, 오늘, 우선, 나는 모든 리포지토리에서 모든 계약을 찾습니다 그러나 지불 조건이 무엇인지 어떻게 알 수 있습니까? 그래서 키워드 검색을하고 계약서의 오른쪽 부분으로 가면 읽으십시오 그래서 여전히 매우 수동적입니다

그것에 도착하기 위해 많은 독서를하고있는 사람의 여기서 우리가 할 수있는 일은 아마도 그것을 좁히는 것입니다 그것이 우리가하고 싶은 것이면 고객에 의해 계약 유형별로 좁히십시오 그래서 우리가 한 분류 하지만 실제로 AI 이해 문서를보고 관련 정보를 추출한다

근본적으로 말하게 해줘, 알았어, 그거 알아? 30 일 내 표준 지불 조건, 그래서 60이나 90이라면 왜냐하면 그것들은 제가 집중해야 할 것들입니다 다시 말하지만, 얼마나 많은 사람들이 알고 있는지 몇 시간의 클릭으로 적절한 결과를 얻을 수 있습니다 세트 그리고 이것은 내가 가장 좋아하는 것입니다 계약을 생각할 때, 아마도 M & A 시나리오에 대해 생각해보십시오

방금 회사를 샀어 GC는 다음과 같이 진행됩니다 우리가 방금 상속 한 인구 집단 내의 고객 1 백만 달러를 초과하는 책임 한도가 있습니까? 얼마나 많은 비표준 조항이있을 수 있습니까? 일반적으로 주말을 잊어 버리는 곳입니다 당신은 오랫동안 독서를 할 것입니다 그리고 솔직히 M & A 사건에서 수십 명의 사람들이 방에 갇혀있다

왜냐하면 며칠이 몇 주가 될 수 있기 때문이며, 얼마나 큰 지에 따라 말 그대로 문서를 통해 독서 다시 우리가 여기서 할 수있는 일은 표준은 무엇이며 비표준은 무엇입니까? 우리는 지식을 사용하여 그러한 것들을 찾을 수 있습니다 기능은 AI 이해 문서와 함께 제공됩니다 그리고 그 정보를 추출하십시오 그리고 변호사에게 손끝에서, 다시 한번, 몇 번의 클릭

다른 유형을 기반으로 필터링하는 기능 문서, 다른 지역, 그게 있다면 그들이 무엇을 찾고 있는지 이 모든 정보는 사실상 클릭하기 만하면됩니다 따라서이 사용 사례가 설명되기를 바랍니다 문서 이해 AI의 힘 진정으로 가치를 창출하기 위해 할 수있는 일 고객이 이러한 유형의 기술을 사용하지 못하게합니다 우리 플랫폼의 일부로 우리는 우리가 끝을 전달할 수있는 것이 중요하다고 생각합니다

솔루션을 종료하여 고객이 실제로 모든 혜택을 누리십시오 이처럼 진보되고 훌륭한 기능을 갖춘 Google이 제공하는 빌드를 정렬하는 것보다 훨씬 더 가치있는 시간으로 모두 너 자신, UI를 만들고, 그 모든 것들, 인프라, 좋은 모든 이들, 그 주위를 돌아 다니는 재미있는 것들 그래서 다시 플랫폼은 매우 유연합니다 우리는 당신이 할 수있는 것이 중요하다고 생각합니다 다양한 콘텐츠 유형에서이를 수행 할 수 있습니다

다양한 콘텐츠 소스에서 다양한 형식으로 예를 들어 마케팅에 대한 예가 있습니다 학과 그 사람들은 비디오를 다루고 있습니다 그들은 이미지를 다루고 있습니다 그들은 데이터 시트를 다루고 있습니다

다양한 콘텐츠 유형 그러나 내가 뭔가를 찾을 때, 일반적으로 문서 유형이 아닙니다 주제별입니다 나는 특정 국가, 특정 언어, 특정 제품 하지만 그 제품에 대한 모든 콘텐츠를 원합니다

또는 그 언어 다시 한 번 다른 형식을 살펴 보는 것이 중요합니다 및 유형 우리를 위해 다시 한 번, 방어 가능 준수는 매우 중요합니다 그래서 우리는 당신이 분류 할 때, 당신은 또한 그것을 활용할 수 있습니다

적절한 정책을 추진할 수 있도록 그 서류들 어떻게하면 내가 가지고있는 것을 안다는 사실을 어떻게 활용할 수 있습니까? 내가 쓸 수 있다고? 그러나 어떻게 적절하게 취급하는지 또한 어떻게 확인합니까? 내가 필요로하는 한 그것을 유지하고있다 나는 그것을 보호하기 때문에 민감한 또는 개인 정보 나는 여기서 다루고있다 또한 하나의 플랫폼에서 여러 이해 관계자에게이를 수행함으로써, 여러 다른 유스 케이스에 걸쳐 그래서 당신은 한 번 열심히 일합니다 당신은 당신을 풍부하게합니다

그러나 여러 이해 관계자에게 이익이됩니다 여러 사용 사례, 고급 분석 일단 자동화 프로그램을 시작했다면 그래서 이것이 도움이되고 무엇을 설명했는지 알기를 바랍니다 우린 여기서하려고하고있어 그리고 나는 그것을 밀라노로 넘겨 줄 것이다 [박수 갈채] MILAN LEE : 안녕하세요

저는 밀라노 리입니다 저는 기계 학습 전문가입니다 Google Cloud에서 우리는 이미 문서 이해 AI가 얼마나 위대한 지 들어 봤습니다 해결책은 정말로 있습니다 내가 그 일의 세부 사항을 보여주고, 그것의 기술

그리고 어떻게 작동하는지에 대한 간단한 데모도 보여 드릴 것입니다 따라서 데모를 보려면 특허 데이터를 분석 할 것입니다 [변덕스럽지 않은] 변리사 변호사 그리고 나는 무엇에 대한 경쟁력있는 통찰력을 얻을 수 있기를 원합니다 서로 다른 회사들이하고있는 일, 그들의 제품 혁신 로드맵입니다

그리고 그 중 하나가 정말 좋은 소식통입니다 특허 데이터를 살펴 보는 것입니다 특허에는 실제로 풍부한 정보가 많이 있습니다 다른 곳에서는 얻을 수 없습니다 저널에서 얻을 수는 없습니다

당신은 회의에서 얻을 수 없습니다 그것들은 보통 꽤 독점적 인 정보이며, 그러나 그것은 공유 될 것입니다 그래서 그것은 내가 이해하는 데 정말로 도움이된다 시장에서 활발한 선수는 무엇인가? 모든 단일 제품에 대해 특허를 통한 독서의 도전은 엄청납니다 그 도전들이 무엇인지 설명해 드리겠습니다

문서 내에서 AI를 사용하는 방법 문제를 해결하는 데 도움이되는 AI 이해 그래서 우리는 미국과 다른 두 가지 특허를 찾고 있습니다 나란히 각 특허에 대해 특허에 흥미로운 점은 무엇입니까? 변호사는 언제 특허가 제출되었는지입니다 그리고 특허 내에는 여러 가지 날짜가 있습니다

그래서 우리는 승인 된 특허 날짜를 가지고 있습니다 또한 특허가 처음 제출 된 날짜도 있습니다 나를 위해,이 두 가지 주요 필드를 자동으로 추출합니다 이미 AI를 사용하는 데 정말로 가치가 있습니다 나는 밖으로 추출 할 때 그걸 확실히 할 수 있기를 바란다

그 필드들을 제대로 채울 수 있습니다 정확한 열의 데이터베이스에서 그리고 정확한 형식으로, 그리고 그 두 날짜를 섞지 마십시오 우리는 여기에 많은 다른 구조화되지 않은 데이터를 볼 수 있습니다 예를 들어 특허의 제목이 있습니다 그리고 제목 자체는 언젠가 꽤 일반적입니다

하지만 때로는 꽤 구체적입니다 그래서 나는 핵심 정보도 추출 할 수 있기를 원합니다 그리고 물론, 삽화가 있습니다 종종 우리에게 말해주는 특허 내에서 이 발명으로 무슨 일이 일어나고 있는지 그것을 향해가는 구성 요소는 무엇입니까? 그렇다면 내가 자동으로 도와 줄 수있는 인공 지능 도구가 있다면 어떨까요? 그렇게 문서를 추출하는 것을 이해하십시오

내가 직접 검토 할 필요가없는 그것을 위해 데이터 입력을 한 다음 이미지를 잘라냅니다 그것을 저장하십시오 그것은 인간의 많은 시간을 절약 할 수 있습니다 따라서 이것은 매우 거대한 노력입니다 그리고 만약 내가 미국을 넘어서서이 일을 정말로 확대하고 싶다면 어떻게해야 할까? 특허권? 유럽 ​​특허를보기 시작하면 어떨까요? 또한 미국과 다른 형식으로 제공됩니다

그들에는 다른 명명법이있다, 다른 분야, 다른 제목, 다른 방법 사물을 표현하는 것 그리고 이걸 몇 가지 해보자 다른 언어를 사용하는 데 어려움이 있습니다 그래서 우리는 영어 외에 독일어, 불어를 할 수 있습니다 기타 유럽 언어를 사용합니다

AI를 사용하여 어떻게 섭취, 이해, 이 모든 문서의 처리 다른 형식, 다른 언어, 단일 환경에서 통합 할 수 있습니까? 그것은 AI가 올 곳입니다 그럼 이해의 라이프 사이클을 거치도록하겠습니다 특허 문서 그리고 이것이 유일한 삶이 아니라는 경고문을 추가하고 싶었습니다 특허에서 채택 할 수있는 것

사용 사례가 무엇인지에 따라 달라집니다 하지만 유스 케이스의 경우, 내가 정말로하고 싶은 것이있다 데이터를 수집 한 다음 처리하는 것입니다 구조화 된 형식으로 시작할 수 있어야합니다 이제 섭취 단계부터 시작합시다

그래서 나는 경제적 인 선택을 원한다 모든 새로운 특허를 저장하고 보관할 수 있습니다 옛 특허 매년 미국에서만 60 만 건 이상의 특허가 있습니다 제기되고있다

그래서 우리는 실제로 저장할 수있는 확장 가능한 방법이 필요합니다 이 모든 특허는 현재 PDF 형식으로되어 있습니다 원시 저장 영역에 저장하십시오 승인? 또한이 솔루션은 PDF 형식의 문서를 가져 오는 것이 아닙니다 사진, 이미지, 비디오 등을 섭취 할 수 있습니다

그래서 우리가 데이터를 섭취 한 후에 그렇지 않은 문서를 쫓아 낼 수 있어야한다 패턴처럼 보이십니까? 이 경우에는 컴퓨터 비전 모델을 사용하고 싶습니다 우리가 비 특허 문헌을 미세하게 조정하고 걷어차는 것을 돕습니다 그런 다음 값으로 이동합니다 그것은 OCR을 적용하는 것입니다

따라서 OCR은 광학 문자 인식 (Optical Character Recognition)의 머리 글자입니다 이미지의 텍스트를 감지하고 추출하는 데 사용됩니다 원시 형식, 원시 텍스트 형식으로 작성하십시오 왜 원시 텍스트 형식으로 추출해야합니까? 그래서 많은 것이 있다는 것이 밝혀졌습니다 자연 언어 처리의 우리 이 원시 텍스트 위에 수행 할 수 있습니다

예를 들어 콘텐츠 분류 모델을 적용 할 수 있습니다 그럼 그게 어때요? 기본적으로 원본 텍스트를 스캔합니다 이 특허의 주제가 무엇인지 파악할 것입니다 따라서 수동으로 특허를 검토하는 대신, 이제 AI를 사용하여 내용이 무엇인지 이해하는 데 도움이됩니다 예를 들어,이 특허는 의료 기술에 관한 것입니까? cryptocurrencies에 관한 것입니까? 컴퓨터 비전에 관한 것입니까? 아니면 다른 것들에 관한 것입니까? AI가 자동으로 이해하도록 할 수 있습니다

우리를 위해 그 과정이 끝나면 추출 할 수 있습니다 내가 관심있는 특정 엔티티 그런 엔티티들이 제목이 될 수 있습니다 특허에 대한 설명, 다른 날짜들 특허에서

내 슈퍼 특정 엔티티로 정의하고 싶은 것은 무엇이든, 기본적으로 내 모델에서 미세 조정할 수 있습니다 그런 다음 개체 검색을 수행하려고합니다 따라서 물체 감지는 기본적으로 이미지와 신호를 찾는 것입니다 이미지 또는 PDF 문서 내에서 그 이미지를자를 수 있고 그 이미지의 xy 좌표를 만들고 데이터베이스에 저장하십시오 마지막으로 구조화 된 방법을 사용합니다

데이터를 분석합니다 그래서 제가하고 싶은 것입니다 정말로 빨리 데모를 실행 해 봅시다 나는 내 시스템에 로그인 할 것이다 승인

그래서 쉘 스크립트를 시작하겠습니다 이 셸 스크립트는 기본적으로 도움이됩니다 내가 모든 AI 서비스를 호출하도록 분류 모델을 생성하는 데 사용됩니다 NLP 모델 및 물체 감지 모델 그리고 나서 그 결과를 보여 드리겠습니다

그래서 저는 스크립트를 시작하겠습니다 그리고 실제로 데모 전에 시작했습니다 슬라이드로 돌아갈 수 있을까요? 그래서 이것이 시작하는 동안, 쉘 스크립트가 시작됩니다 각 모델은하고있다 따라서 첫 번째 모델은 기본적으로 분류됩니다

유럽 ​​특허, 미국 특허, 데이터 시트라는 또 다른 범주는 이것은 특허 그 자체에 대한 세부 사양입니다 따라서 이러한 특정 카테고리를 분류하기 위해, 우리는 그것을 위해 커스텀 모델을 사용해야 할 것이다 제네릭 모델은 Google API는이 세 가지에 대해 충분히 구체적이지 않습니다 카테고리 그래서 데모에서 모델을 훈련시키기 위해 약 500 개의 샘플을 사용했습니다

그리고 나는 100 % 정밀도에 매우 근접 할 수있었습니다 내 모델 성능에 대해 100 % 리콜 일반적으로 두 가지 측정 항목이 사용됩니다 모델이 얼마나 강력한 지 판단 할 수 있습니다 따라서 500 개의 샘플을 사용하여 단일 라인을 작성하지 않고 프로그래밍을 할 필요없이 텐서 흐름 코드의 차별화하도록 모델을 미세 조정할 수 있습니다

다른 특허들 사이 그래서 이것이 데이터 시트를 걸러내는 곳입니다 그런 다음 다음 부가가치 프로세스로 이동하십시오 그래서 우리는 OCR을 적용합니다 보시다시피, 특허 내에 있었던 모든 것 PDF 이제 원시 텍스트로 변환됩니다

그것은 아직 재미 있지 않습니다 다음 흥미로운 부분은 또 다른 인공 지능입니다 우리는 특허 내의 내용으로 분류하려고했습니다 따라서 콘텐츠를 검색하여 서로 다른 문장을 파싱 할 수 있고, 코퍼스에서 의미 론적 의미를 이끌어 낼 수있다 텍스트로, 우리는 카테고리가 무엇인지를 결정할 수 있습니다

또는이 특허의 내용은 무엇입니까? 그래서 바로 내 데모에서, 나는 세 가지 카테고리 그러나 이것은 많은 카테고리가 될 수 있습니다 비즈니스 도메인에 필요한만큼 그리고 다시, 저는 모델을 아주, 아주 아주 열심히 훈련해야합니다 이런 종류의 정확성과 정확성을 얻기 위해 몇 가지 샘플 내 모델에서

그래서 이것이 제가 말하고있는 것입니다, 예를 들면, 모델을 실행할 때마다, 모델을 호출 할 때마다, 내가이 상황에 대한 확률을 얻을 수있을 것이다 의료 기술, cryptocurrencies, 또는 컴퓨터 비전 우리가 그 내용을 안다면, 우리는 [INAUDIBLE] 엔티티를 추출하려고합니다 이것은하기가 꽤 어렵습니다 Google에는 무료 교육을받은 API가 있습니다

객체, 이름, 경계표 같은 공통 엔티티를 추출하고, 등등 그러나 특허 문서에만 국한되지는 않습니다 여기서 AutoML을 사용하여 모델을 미세 조정합니다 내가 원하는 정보 만 추출하십시오 기억하십시오

왜냐하면 우리는 우리 특허의 언어가 다르다 우리는 다른 형식을 가지고 있습니다 그래서 정보의 위치 당신이 가진 모든 특허간에 다른 것일 수 있습니다 AutoML을 사용하면 솔루션 내에 있습니다 정확한 엔티티를 미세 조정하고 추출 할 수 있습니다

우리가 가장 높은 정확도로 필요한 필드의 그리고 마지막으로 상자에 그려 넣기를 원합니다 다시 말하지만, 이것은 일러스트레이션을 이해하는 데 매우 중요합니다 본 발명 자체의 따라서 물체 감지 기술 기본적으로 모든 객체를 식별합니다 당신이 식별하기를 원합니다

여기에 여러 개의 객체가 있다면, 당신은 당신에게 가장 중요한 물건을 식별하도록 선택할 수 있습니다 그 이미지를 xy 좌표로 추출하면됩니다 그리고 마침내 우리는 우리가 어떻게 우적 씹을 수 있는지를 보았습니다 비정형 데이터 주변 그리고 마침내 도착합니다 매우 구조화 된 방식을 취할 목적지까지 우리의 데이터를 이해합니다

이 경우 모든 데이터를 저장하기 위해 BigQuery를 사용하기로 결정했습니다 이것은 다른 종류의 분석 데이터베이스 일 수 있습니다 목적지는 아마도 다른 서비스 일 수 있습니다 예를 들어, 이렇게 될 수 있습니다 이것이 문서 이해 AI 솔루션 내에 있습니다

기본적으로 찾는 데 도움이되는 연관성 및 데이터 간의 관계 그래서 예를 들어, 나는 발명가가 여러 명일 수 있습니다 특정 기술과 나는 관계를 찾을 수 있기를 원한다 저자, 발명가 또는 다른 콘텐츠 내 특허가있는 영역 지식 서비스는 시각적으로 도움이됩니다

그 관계를 찾는다 SUDHERRA VANGURI : 고맙습니다, 밀란 내가 감싸기 전에, 손을 빨리 보여줘 그래서 우리는 약 7 개의 파트너 이야기를 읽었습니다 4 가지 핵심 사례 연구를 거쳤습니다

그 [? Anka?]는 Iron Mountain에서 지적했다 특허 사용 사례 이 유스 케이스 중 얼마나 많은 것이 공감 하는가 일부 문서 처리 중 회사 또는 비즈니스에서 본 워크 플로? 와우 거의 모든 사람들이 계약을 맺고 있다고 생각합니다 얼마나 많은 이들이 이러한 문서 사용을 보지 못했습니까? 케이스? 당신이 무엇을 놓친 적이 있습니까? 와, 우리는 모든 것을 가지고있다

오, 나는 그것을 본다 글쎄, 나는 그 세션이 끝날 때까지 너는 내가 우리 문서의 일부를 시험해 보는 것에 흥분한다 이해 능력 우리의 파트너 통합은 귀하를 매우 쉽게 만듭니다 그것은 당신을 위해 가치있는 가장 빠른 시간입니다

이러한 배포를 시작하여 실행할 수 있습니다 우리는 수직 계열의 많은 회사를 볼 수 있습니다 몇 가지를 강조하기 위해 에너지 회사를 지구 물리학 자의 워크 플로우를 자동화하려고 노력한다 새로운 사이트와 관련된 위험을 평가합니다 문서 이해 AI 사용 또는 문서 이해 사용 가능 AI가 식별 할 수있는, [INAUDIBLE] 매개 변수 매우 기술적 인 지구 물리학 문서에서 ML 전문 지식이 많이 필요합니다

이러한 공급자 중 하나는 문서 이해 AI 무엇이 자동화되고 서비스 문서, 원본 문서 그리고 우리는 이러한 종류의 분류를 보았습니다 [INAUDIBLE]뿐만 아니라 우리의 문서 분류는 일반적으로 96 %의 정확도를 제공합니다 예를 들어, Egnyte는 973 % 보안 문서 분류에 대한 정확성

우리의 건강 관리 회사는 문서 이해 AI 그들의 임상 실험 과정에서 많은 의사의 환자 기록이 있습니다 매우 전문적인 분석이 필요합니다 그리고 분석을 원할 수도 있습니다 음, 복용량이 얼마이고 인플루엔자가 무엇인지, 또는 그 환자 기록에있는 어떤 증상이 무엇인지

그리고 이러한 수직 활용 사례가 확대되는 것을 봅니다 여러 산업 분야에 걸쳐 예를 들어, 계약은 편재합니다 여러 카테고리 및 계약 처리 이 모든 산업이 문서 이해 AI를 사용하여 분석 할 수 있습니다 그리고 소매 고객, 예를 들어, 고객 의견을 분석 할 수 있습니다 트윗, 댓글, 티켓, 서비스 생각하기 분석 할 수있는 티켓 이 구조화되지 않은 데이터는 모두 구조화 된 데이터로 변환된다

문서 이해 AI 도구를 사용합니다 이를 통해 cloudgooglecom을 사용해 보도록 권하고 싶습니다 / solutions / docum ent-understanding

방문하여 의견을 보내주십시오 우리는 항상 새로운 유스 케이스 고객에게 놀라움을 금치 못합니다 올라와 그리고 때때로 우리는 그들에 의해 놀란다 그러니 피드백을 주시기 바랍니다

나는 질문에 매달릴 것이다 참석해 주셔서 대단히 감사드립니다 AI 이해하기 문서를 사용해보십시오

Google AI's Take on How To Fix Peer Review

동료 학자 여러분, Károly Zsolnai-Fehér와 함께하는 2 분간의 논문입니다 그것은 위치 종이에 대한 시간입니다

이 신문에는 이러한 비디오에서 볼 수있는 일반적인 시각적 불꽃 놀이가 없습니다 그러나 그것은 과학 출판의 초석을 다룬다 리뷰 연구 그룹이 프로젝트로 완료되면 결과를 작성하는 것이 아니라 종이를 저장소에 집어 넣지 않고 대신 과학적 장소에 제출합니다 인스턴스, 저널 또는 컨퍼런스

그 다음, 개최지는 함께 일을 기꺼이하는 몇몇 다른 연구자를 찾습니다 가는 빗 이중 맹검 리뷰의 경우 저자와 리뷰어는 익명으로 남습니다 서로에게 리뷰어는 결과가 참으로 중요하고, 새롭고, 신뢰할 만하며, 재생할 수 있는

개최지가 정말로 좋으면,이 과정은 매우 힘들고 철저합니다 이것은 과정입니다 누군가의 지옥을 때리는 과학적 버전이되지만 건설적인 방법 작품이 심각한 비난을 견딜 수 있고 필요한 상자를 틱하면 진행할 수 있습니다 이 장소에서 출판하기

그렇지 않으면 거부됩니다 우리가 지금까지 들었던 것은 연구 작업이 검토되고 있다는 것입니다 그러나 과학자 Google AI 실험실에서 검토자가 직접 검토해야한다는 문제가 제기되었습니다 모든 과학자들이 특정 비율의 더 큰 이익을 위해 봉사 할 시간 예를 들어, 나의 PhD 연구 전반에 걸쳐 30 가지 이상의 논문을 검토했으며, 심지어 완료되었습니다

이 논문 리뷰는 보상없이 실시됩니다 지금이 문제를 1 번으로 부르 자 이슈 2는 시간이 지남에 따라 제출 횟수가 폭발적으로 증가한 것입니다 가장 권위있는 기계 학습 및 컴퓨터 비전 컨퍼런스 여기 좀 봐

가능한 한 공정한 검토 시스템을 만드는 것이 가장 중요합니다 결국, 연구 프로젝트에 수천 시간을 소비하는 것이 위험에 처해 있습니다 이 두 가지 문제를 함께 추가하면 시스템의 평균 품질이 리뷰는 시간이 지남에 따라 거의 확실히 감소 할 것입니다 저자 인용 : "우리는 핵심 이슈가 구조적이라고 생각합니다 리뷰 작성자는 소중한 시간과 전문 지식을 익명으로 커뮤니티 서비스에 기부합니다

보상이나 귀속없이, 급증하는 제출물에 의해 점차 세금이 부과됩니다 집행 된 기준에 묶이지 않는다 "고 밝혔다 2 Minute Papers 에피소드 84 번에서 200 개 이상의 에피소드 전에 NeurIPS 실험 그 당시에 돌아 다니고 2 분간의 논문을 즐겼다면 의견을 남겨주세요 멋졌어! 그러나 이것이 사실이 아니라면 걱정하지 마십시오

이것은 오래 전 이었으므로, 여기에 짧은 요약이 있습니다 많은 양의 논문이 비밀리에 여러위원회에 배포되었고 검토를 거쳤습니다 우리는 서로에 대해 알지 못하고 받아 들일지 거부 할지를 살펴볼 것입니다 같은 신문 논문을 재검토하고 결과가 동일한 지 확인하십시오

정교한 수학을 사용하여 새로운 과학적 방법을 만들면 수학을 사용하지 않는 이유는 무엇입니까? 우리 자신의 프로세스를 평가할 수 있습니까? 그래서, 그 후, 주어진 규정 된 수용 비율에서, 논문의 57 %가 의견 차이가났다 그럼,이 숫자는 좋든 나쁘지? 그들이 무엇을하고 있는지 전혀 모르는 완전히 가설적인위원회를 상상해 봅시다 검토를 통해 그들은 기본적으로 동전을 버리고 종이를 수락하거나 거부합니다 cointoss의 결과에 코인 플립위원회라고 부르 자

계산은 Coinflip위원회가 불일치 비율을 가질 것이라고 결론 지었다 약 77 %이다 그래서 전문가들, 57 %의 의견 불일치, Coinflip위원회, 77 %의 의견 불일치 그리고 지금, 이것이 좋은지 나쁜지 대답하기 위해 : 이것은 자랑스러워 할 일이 거의 없습니다 – 전문가 리뷰어의 일관성이 코인 플립에 훨씬 가깝다

가설적인 완벽한 검토 프로세스 이것이 우리가 이것에 관해 뭔가해야한다는 표시가 아니라면, 나는 확실하지 않다 뭐야 따라서이 논문에서 저자는 시스템을 개선하기위한 두 가지 중요한 변화를 제안합니다 이러한 문제 : 구제 수단 1 번 – 루 브릭을 제안하고, 품질을 평가하기위한 7 점 문서 리뷰 중 다시 말하지만, 논문뿐만 아니라 리뷰 자체도 검토됩니다

공립학교에서 학생의 성취도를 평가하기 위해 사용하는 것과 비슷합니다 검토가 객관적이고 일관되며 공정한 것인지 여부 구제 수단 2 번 – 평가자는 자신의 업무에 대해 인센티브를주고 보상을 받아야합니다 저자들은 전문적인 서비스가 전문적인 보상에 합당해야한다고 주장한다 지금은 물론, 이것은 훌륭한 것처럼 들리지만, 이것은 또한 돈이 필요합니다 자금은 어디에서 오는 것이 좋습니까? 이 신문은 몇 가지 옵션에 대해 논의합니다 : 예를 들어, 이것은 후원을 통해 지원 될 수 있으며, 또는 동료 평가를 위해 논문을 제출할 때 합리적인 수수료를 요구하고, 과학 회의를위한 새로운 수수료 구조

이 책자는 누구나 쉽게 읽을 수있는 짧은 5 페이지 용지이며, 매우 중요한 문제에 대한 요점, 말할 필요도없이, 나는 당신이 그것을 줄 것을 강력히 권한다 언제나처럼, 링크는 비디오 설명에 있습니다 이 비디오가이 문제에 대한 인식을 높이는 데 도움이되기를 바랍니다 연구 논문 평가를위한 공정한 시스템을 만들려면 이러한 권리를 얻는 것이 좋습니다 지켜 주셔서 감사 드리며 다음 번에 다시 보겠습니다

How machine learning helps identify potholes on Los Angeles roads

알레한드라 바스케스: 안녕하세요, 저는 알레한드라에요 에릭손 에르난데스: 저는 에릭손입니다 알레한드라 바스케스: 저희는 머신러닝을 활용해 LA 도로의 움푹 팬 곳 즉, 포트홀을 찾아내고 있어요 에릭손 에르난데스: LA에 있는 국도와 고속도로는 길이가 11,900km가 넘어요 알레한드라 바스케스: 도로가 이렇게 많은 만큼 수리해야 할 부분도 많죠 에릭손 에르난데스: 지금은 건설 노동자들이 도로에 위험한 포트홀이나 균열이 있는지 일일이 검사하거나 사람들의 신고에 의존해야 하는데 그러려면 시간이 많이 걸리죠 알레한드라 바스케스: 로욜라 메리마운트 대학에서 공부하면서 저희는 LA 전역에 걸쳐 도로 위 포트홀을 더 빠르게 찾아내는 방법을 연구하기 시작했어요 에릭손 에르난데스: 우선 데이터가 필요했죠 그래서 자동차에 카메라를 달고 돌아다니면서 여러 국도와 고속도로를 촬영했어요 알레한드라 바스케스: 그런 다음 Google의 오픈소스 머신러닝 도구인 TensorFlow를 사용해 도로 위 포트홀이나 균열 혹은 다른 이상을 아주 빠르고 정확하게 파악하는 모델을 개발했어요 따라서 작업자들이 포트홀을 찾는 데 드는 시간을 줄이고 포트홀을 수리하는 데 집중할 수 있어요

Cloud OnAir: AI Inference on GCP: How to get the best out of GCP VMs with Intel Xeon Scalable

[음악 재생] SHAHH SHAHIDI : 클라우드 OnAir에 오신 것을 환영합니다 Google Cloud에서 웹 세미나를 생방송하십시오

매주 화요일마다 웨비나를 개최합니다 내 이름은시다 그리고 오늘 저는 GCP와의 AI 추론에 대해서 이야기 할 것입니다 인텔에 언제든지 질문 할 수 있습니다

인텔 및 Google 직원이 있습니다 누가 너의 질문을 할거야 시작하자 우리는 인텔 제온의 가치 제안에 대해 이야기 할 것입니다 및 GCP 및 인텔과 함께 GCP 환경을 구성하는 방법 하드웨어 및 소프트웨어 최적화, 귀하의 인공 지능을위한 최고의 성능을위한 도구 및 도구 신청

우리는 당신에게 작품 중 일부를 소개 할 것입니다 Google과 함께 2 회에 걸쳐 우리가 이러한 최적화를 가져올 수있는 방법 GCP에서 사용 가능하고 사용하기 쉬운 도구를 제공합니다 그래서 여기서 이야기의 아젠다가 있습니다 먼저 인텔에 대한 간단한 개요를 살펴 보겠습니다 AI에서 우리의 전략과 강점

우리는 우리의 제온 CPU에 대해 계속 이야기 할 것입니다 GCP에서 사용할 수 있습니다 그런 다음 AI에 대한 최상의 성능을 얻는 방법에 대해 이야기합니다 응용 프로그램, 다른 프레임 워크 조정 및 최적화 우리의 하드웨어에서 최고의 성능을 발휘합니다 마지막으로 우리는 2 년 이상의 협력에 대해 이야기합니다

Google Cloud를 사용하여이 성능을 쉽게 구현할 수 있습니다 GCP 개발자가 사용할 수 있습니다 나는 AI 고객의 진짜 예를 들고 싶다 인텔이 AI에 가져다주는 가치를 강조했다 이것은 산업 결함 검출의 라이프 사이클을 보여주고있다

계획 그리고 우리는이 라이프 사이클의 붕괴를 보여주고 있습니다 다른 단계로 다른 프로젝트들은 시간대별로 다르지만, 단계는 일반적으로 동일합니다 하단에서 솔루션 전체 시간 완전한 인공 지능 여행입니다

기회 평가부터 개발까지의 단계 최종 결과에 대한 평가 등의 작업을 수행합니다 중간에 개발 및 배포 부분을 확대합니다 데이터를 소싱하는 것을 포함하는 전체 솔루션 개념 개발 추론 전개 증명, 광범위한 응용 프로그램과의 통합도 가능합니다 상단에서 우리는 증명을 더 확대합니다 개념 개발 자체의 데이터 준비가 완료되었음을 알 수 있습니다 개발 시간의 대부분은, 그 다음에 모델을 훈련하고 테스트를하고, 플러스 문서

보시다시피, 많이 있습니다 계산 집약적 인 부분 전후에 일어날 필요가있다 우리가 핵심 기계 학습으로 지칭하는 생명주기 그리고 깊은 학습 단계 인텔은 전체 라이프 사이클에 걸쳐 고객과 협력합니다 솔루션에 대한 전반적인 시간을 단축 할 수 있습니다

데이터의 전반적인 흐름을 생각하는 것이 중요합니다 데이터 관리 및 기타 두통을 포함하여, 오히려 배포를 빠르게 수행 할 수있는 방법은 무엇입니까? 솔루션의 한 부분을 프리미엄급으로 가속화하는 것보다 자,이 개념을 조금 더 확장하기 위해, 여러 접근법을 간략하게 살펴 보겠습니다 배포 및 개발 전에 데이터를 준비하십시오 사이클 접근 방식 결정의 핵심 요소 데이터 스펙트럼에 착륙하는 곳입니다

귀하의 데이터가 하나의 출처 또는 다수 출신입니까? 구조화되었거나 구조화되지 않았습니까? 얼마만큼의 볼륨을 다루고 있습니까? 임무가 치명적인가 아닌가? 스트리밍 라이브 또는 배치입니까? 누구에게 접속해야합니까? 이것들은 여러분이 프로세스를 시작하기 전에 질문해야합니다 깊은 학습 여정 규정 요구 사항이 있습니까? 이러한 질문에 대한 귀하의 답변에 따라, 우리는 다른 접근 방식과 다른 도구를 추천 할 것입니다 데이터를 통합, 저장, 처리, 관리 및 분석 할 수 있습니다 예를 들어 실시간 스트리밍 데이터를 여러 센서에서 오는 통합 된 높은 처리량을위한 도구를 고려하고 싶습니다

낮은 대기 시간의 실시간 데이터 처리를 제공합니다 최종선에는 많은 다른 접근이있다 데이터를 설정하고 AI에서 데이터 준비하기 개발 및 배치 인텔은이 분야에서 방대한 생태계와 함께 작업합니다 솔루션을 최적화하여 실행 최신 하드웨어에 가장 적합합니다 이러한 최적화를 활용하면 데이터 준비주기에 최상의 성능을 제공하고, 관리를위한 오버 헤드와 두통이 거의없고 전혀 없습니다

데이터 이동 이제 우리는 서로 다른주기에 대해 이야기했습니다 우리가 핵심 기계 학습에 도달하기 전에, AI 응용 프로그램의 깊은 학습, 인텔의 완벽한 포트폴리오를 간략하게 살펴 보겠습니다 소프트웨어 및 솔루션 사실 인텔의 다양한 하드웨어 제품 포트폴리오에서 실행됩니다 우리의 소프트웨어 스택을 통해 우리는 모든 수준을 목표로합니다

인공 지능 전문 지식과 참여, 도서관 개발자, 데이터 과학자, 앱 개발자에게 도움이됩니다 우리는 또한 풍부한 솔루션 카탈로그를 보유하고 있습니다 내부 및 공개 사용 사례를 기반으로 솔루션 아키텍트와 공유 서로 다른 부문에 걸쳐 약간의 작업을 단순화하기 위해 이 도구들 중 몇 가지에 집중하고 싶다 오늘날 대부분은 GCP 개발자에게 적용됩니다 인텔 제온 프로세서부터 시작해 보겠습니다

우리의 인공 지능 솔루션의 토대가되는, 특히 GCP에서 우리는 몇 가지 개선 사항에 대해 이야기 할 것입니다 최신 세대의 Xeon CPU 어떻게 AI가 더 나은 성능을 발휘할 수 있는지 신청 다음은 오픈 소스 심 신경 네트워크 인 MKL-DNN입니다 우리 CPU의 기능 라이브러리 개발자는 이러한 프리미티브를 사용하여 가속화 할 수 있습니다 우리 하드웨어의 성능

그런 다음 인텔과 함께 스택의 다음 계층에 집중합니다 최적화 된 프레임 워크, 특히 TensorFlow, 이 프리젠 테이션의 목적을 위해, Intel의 Python 배포판도 포함되어 있습니다 마지막으로, 우리는 우리의 깊은 학습 개발에 초점을 맞출 것입니다 툴킷, 추측을 가능하게하는 OpenVino 다양한 하드웨어에서 최적화 된 성능 제공 통합 API를 사용하는 배경 인텔, 구글과 제휴 오랫동안 데이터 센터 인프라에 대한 2016 년 이래로 우리는 긴밀히 협력 해 왔습니다

하드웨어에서 실행되는 클라우드 솔루션에 GCP를 사용합니다 AI에 대한 우리의 계약 전략을 요약하면, 우리가 집중하는 세 가지 기둥이 있습니다 첫 번째는 제품입니다 Google과의 긴밀한 협력을 통해, GCP는 최초의 클라우드 서비스 제공 업체였습니다 최신 제온 확장성에 대한 액세스 제공 클라우드 환경의 프로세서, 심지어 몇 달 우리 제품의 일반적인 시장 가용성 전에

Google은 항상 기술의 최첨단에 있습니다 그리고 우리는 시간을 제공하기 위해 계속해서 협력합니다 GCP 개발자를위한 제품을 시장에 내 놓습니다 우리 전략의 두 번째 기둥 도구 및 라이브러리 작업 하드웨어 성능을 최대화 할 수 있습니다 이 작품은 제가 앞서 설명했듯이, 소프트웨어의 여러 레이어에 걸쳐 있음 프리미티브 및 라이브러리에서부터 유니 파이드 컴파일러 및 SDK에 이르기까지, 최적화 된 심층 학습 및 기계 학습 프레임 워크

마지막으로 GCP와 협력합니다 GCP에서 이러한 도구를 사용할 수 있고 쉽게 액세스 할 수 있도록 개발자를위한 환경 그럼 우리 제품에 대해 조금 이야기 해 봅시다 스카이 퀘이크 (Skylake)라고도 알려진 인텔 제온 (Intel Xeon) GCP에서 사용할 수있는 최신 인텔 CPU입니다 2017 년 1 분기 이후 이러한 프로세서는 CPU 코어의 수를 늘립니다

이전 세대에서 50 % 큰 VM으로 변환합니다 이제 Skylake 기반 VM을 선택할 수 있습니다 최대 96 개의 vCPU 및 최대 14TB의 메모리를 제공합니다 Skylake는 또한 많은 마이크로 아키텍처 상당히 큰 캐시를 포함하여, 더 큰 데이터를 저장할 수있는 응용 프로그램으로 변환됩니다

코어에 가까운 구조 데이터 구조가 코어에 맞지 않는 경우, 메모리에 더 빨리 액세스 할 수있는 메모리 대역폭이 더 있습니다 그리고 실행 측에, Skylake 많은 명령어의 명령어 대기 시간을 줄입니다 더 넓은 실행을 추가합니다 동시에 Skylake는 최신 버전을 구현합니다

인텔 벡터 명령어 인 AVX-512, 벡터에서 이전 세대의 두 배 폭을 제공합니다 부동 소수점 성능을 최대 82 % 향상시킬 수 있습니다 이 모든 것이 더 빠른 vCPU 및 컨테이너로 변환됩니다 GCE 및 GKE의 Skylake 및 기타 GCP 제품을 기반으로합니다 아시다시피, 필수 요소 중 하나 길쌈 신경 네트워크 모델링 뒤에 행렬 곱셈입니다

Xeon CPU에서는 명령어를 가속화합니다 이러한 작업을 가능한 효율적으로 수행 할 수 있습니다 Skylake는 오늘 FP32 벡터를 지원합니다 곱하기 및 덧셈 명령, INT8 명령 차세대 Intel Xeon 프로세서 새로운 VNNI 지침을 제공합니다 VNNI는 벡터 신경망 명령을 나타냅니다 하드웨어 가속을 포함합니다

INT8 컨볼 루션 명령 차세대 인텔 제온 프로세서에서, 흡입 작동을 수행하기위한 3-AVX 명령 하나에 융합되어 소비로 인해 속도가 향상됩니다 클럭주기가 짧다 우리는 프레임 워크 개발자들과 긴밀히 협력하고 있습니다 이 지침을 통합하기 위해 그들이 활용할 수 있도록 프레임 워크에 이러한 지침에 따른 성능 향상 귀하의 응용 프로그램에

그래서 우리는 새로운 지침에 대해 이야기했습니다 하드웨어의 모든 장점 우리의 신제품이 GCP에 가져다줍니다 그러나 모든 하드웨어는 소프트웨어만큼이나 우수합니다 그것의 위에 달리는 따라서 하드웨어에 기능을 제공하는 것 외에도, 우리는 소프트웨어 최적화에 집중 해 왔습니다

하드웨어의 모든 기능을 활용할 수 있습니다 우리는 지난 몇 년간 매우 긴밀하게 관계를 맺어 왔습니다 다른 프레임 워크 개발자들과 함께 라이브러리를 통합하고 최적화를 업스트림합니다 다음은 Google 최적화의 예입니다 1 년 반 동안 일해야합니다

Skylake CPU를 공개적으로 출시 한 2017 년 7 월부터, 추측에 약 54 배의 향상이있었습니다 성능, 전적으로 소프트웨어 최적화에서 동일한 인텔 하드웨어 비교 우리 최적화의 힘을 말할 수 있습니다 내년까지 우리의 차세대 Xeon CPU 공개적으로 사용할 수 있습니다 추론 성능이 대략 두 배가 될 것으로 예상하고, 새 하드웨어 가속으로 인해 지침, 구현 및 추가 성능 최적화

이 차트는 ResNet 50 성능을 기반으로합니다 분명히 컴퓨팅 부하가 적은 워크로드의 경우, 하드웨어에 다른 병목 현상이있는 경우, 결과는 덜 발음되지만 여전히 매우 중요합니다 자, TensorFlow에 약간 초점을 맞추자 프레임 워크 최적화에 대해 간단히 이야기하십시오 우리는 우리의 최적화 된 심 신경 네트워크에 대해 일찍 말했습니다 라이브러리

앞서 언급했듯이 MKL-DNN은 오픈 소스 수학 커널 라이브러리입니다 깊은 신경 네트워크 및 주요 빌딩 블록 우리의 프레임 워크 최적화 MKL-DNN은 때로는 매우 낮은 레벨을 사용하여 고도로 최적화되어 있으며, 어셈블리 코드만큼 낮습니다 API는 피드백과 상호 작용으로 개발되었습니다 주요 프레임 워크 소유자와 최적화는 여러 레이어에서 수행됩니다

첫째, 컨볼 루션 (convolution)과 같은 모든 프리미티브 (primitive) 행렬 정규화 및 행렬 정규화 최신 와이드 벡터를 활용하도록 다시 작성 명령 다음으로 서로 다른 레이어가 병렬화됩니다 사용 가능한 모든 코어를 효율적으로 사용할 수있게합니다 하드웨어에서 마지막으로, 프리 페칭, 캐시 블로킹 기술 및 데이터 형식 공간적, 시간적 지역성을 촉진하는 것 실행시 데이터를보다 유용하게 만드는 데 사용됩니다

단위에 필요합니다 MKL-DNN 프리미티브를 사용하는 것 외에도, 우리는 다른 기술을 사용하여 TensorFlow에 통합합니다 우리가 레이아웃 최적화를 좋아하는 것들이 있습니다 기본 TensorFlow 작업 교체, 퓨즈 작업, 전파 중간 상태 그리고 우리는 우리의 커스텀 CPU 풀 할당자를 가지고 있습니다

기본적으로 값 비싼 페이지 손실을 피하는 데 도움이됩니다 페이지가 지워집니다 Google은 이러한 최적화 작업을 위해 Google과 협력 해 왔습니다 2 년 이상 협력하고 계속 협력하십시오 새로운 지침과 프레임 워크에서 이익을 실현 공연

이제는 TensorFlow 및 기타 심층 학습에 더하여 우리는 파이썬에 최적화 된 라이브러리 우리는 NumPy, SciPy 및 SciKit-Learn를 가속화했습니다 인텔 MKL과 최적화는 conda와 Anaconda를 통해 가능합니다 일반 대중을위한 클라우드 및 다시 상류로 돌아옴 메인 파이썬 트렁크에 자세한 내용을 알고 싶다면 Intel 배포판에서의 Python 및 일부 성능 증거 [INAUDIBLE], 우리는 좋은 글을 남겼습니다 인텔 웹 사이트 소프트웨어에서 확인하십시오

나는 당신이 참조 할 수있는 슬라이드에 링크가 있다고 생각합니다 다음은 scikit-learn 라이브러리를 사용하는 예입니다 GCP 환경에서 중요한 성과 달성 속도를 올리다 이것은 K-Means 클러스터링 알고리즘을 사용하고 있습니다 최대 23 배 빠른 이득을 볼 수 있습니다

인텔 scikit-learn 대 주식 scikit-learn 사용 파이썬의 라이브러리 그리고 이것은 96 vCPU Skylake 인스턴스의 GCP에서 실행됩니다 이제 우리는 인텔 최적화 라이브러리에 대해 이야기했습니다 그리고 프레임 워크, 나는 약간의 시간을 보내고 싶다 Google과의 공동 작업에 대해 이러한 최적화 성능을 제공하는 클라우드 GCP에서 쉽게 액세스 할 수있는 자산으로 사용할 수 있습니다

우리는 Intel 최적화 된 Docker 이미지를 생성했습니다 TensorFlow 및 인텔 배포 Python Docker Hub와 GitHub에서 이 Dockers에 액세스 할 수있는 링크가 있습니다 기본적으로 이것은 소프트웨어의 모든 장점을 가져올 것입니다 한 번 클릭으로 Docker 이미지를 다운로드 할 수 있습니다

그래서 이들을 사용하여 더 빠르고 효율적으로 개발할 수 있습니다 또한 Google과 협력 해 왔습니다 파이썬의 인텔 배포판을 만들기 위해, 뿐만 아니라 일부 인텔 성능 라이브러리, Google 컨테이너 레지스트리에서 사용 가능합니다 인텔 성능 라이브러리에는 라이브러리 인텔 수학 커널 라이브러리, 인텔 스레딩 빌딩 블록, Intel NPI, IPP 및 데이터 분석 가속 라이브러리 VM에서이 라이브러리를 사용할 수 있으려면, 당신은 런타임이 실제로 있는지 확인해야합니다

이 라이브러리에서 사용할 수 있습니다 링크에 대한 좋은 지시 사항이 있습니다 런 타임을 다운로드 할 수있는 웹 사이트 VM 인스턴스에서 사용할 수 있도록합니다 인텔 최적화 라이브러리가있는 컨테이너 외에도, 우리는 Google과 협력 해 왔습니다 최적화 된 가상 시스템 이미지를 만듭니다

사용 및 배포 용이성 외에도, 이러한 이미지는 개발자가 항상 최신 버전의 최적화 활용 이 이미지들을 통해 최근 GCP는 인텔 최적화 된 두 개의 VM 이미지를 발표했습니다 하나는 TensorFlow, 1120을 사용하여 최신 MKL-DNN 및 MKL 라이브러리, 인텔 최적화가 적용된 또 하나 세 개의 파이썬 라이브러리 – numPy SciPy와 scikit-learn

이러한 이미지는 환경 변수 설정을 자동화합니다 올바른 변수를 사용하고 Google Cloud를 통해 사용할 수 있습니다 마켓 플레이스, GCE, OS 이미지 및 명령 줄 인터페이스 조금 시간을 보내고 싶다 시작하는 방법을 안내합니다 GCP에서 올바른 플랫폼을 선택하는 방법 최적화 된 이미지에 액세스하는 것

Google Compute Engine에서 시작하려면 인스턴스 생성, CPU 플랫폼 풀다운 메뉴로 이동 Intel Skylake 이상을 선택하십시오 귀하의 신청서가 최신 하드웨어 향상 기능을 활용할 수 있습니다 Skylake의 장점에 대해 이전에 이야기했습니다 이전 세대 CPU보다 그리고 가용성 측면에서, Skylake는 현재 17 개 GCP 지역 중 16 개 지역에서 사용할 수 있습니다 콘솔을 사용하지 않는 경우 Cloud Shell에서 min-cpu-platform 플래그를 사용할 수 있습니다

CPU를 선택하십시오 Skylake 가용성을 갖춘 16 개 존 중 하나에서, 인텔 스카이 레이크에 플래그를 설정할 수 있습니다 Skylake에서 실행되도록 VM을 만들 때 앞에서 설명한 것처럼 VM 이미지의 주요 전제 인텔 최적화 및 도구를 쉽게 만드는 것입니다 GCP 개발자가 사용할 수 있습니다

Intel에서 VM 이미지에 액세스하는 방법 중 하나 최적화 된 TensorFlow 또는 Intel 최적화 Python은 Google Cloud Marketplace를 사용합니다 Google Cloud Console 환경에서, 마켓 플레이스를 클릭하고 심층적 인 학습 VM 이미지를 찾으십시오 클릭 한 번으로 배포 할 수 있습니다 VM상의 이러한 이미지 GCE에서이 이미지에 액세스 할 수도 있습니다

설정하는 동안 더 많은 제어 기능을 찾고 있다면 VM, 최적화 된 OS 이미지 배포 부팅 디스크를 변경하고 하나를 선택하여 인텔 최적화 이미지 최적화를 최대한 활용하려면 최신 아키텍처에서 Intel Skylake로 CPU 플랫폼을 선택해야합니다 또는 나중에이 작업을 수행하는 동안 그리고 Google 콜 커맨드 라인 인터페이스를 사용하는 경우, 다음 명령을 사용하여 VM 이미지를 시작할 수 있습니다 라인 옵션 이미지 계열 변수를 Intel 고유의 이미지 중 하나로 설정하십시오

인스턴스를 작성할 때 유형을 지정하십시오 min-cpu-platform 변수를 설정할 수도 있습니다 최신 인텔 CPU, Skylake 이제 툴킷에 대해 이야기하고 싶습니다 그래서 우리는 도서관에 관해 이야기했습니다 우리는 소프트웨어 스택의 여러 레이어에 대해 이야기했습니다

그리고 지금까지 라이브러리와 프레임 워크에 중점을 두었습니다 그리고 우리 툴킷에 대해 조금 이야기하고 싶습니다 인텔 하드웨어를 개발하는 데 도움이되는 것 Google Cloud를 사용한 최신 프로젝트 Kubeflow 파이프 라인에있다 그리고 우리는 통합 작업을하고 있습니다

개발 툴킷의 일부를 Kubeflow 파이프 라인에 통합합니다 이전에 우리는 우리의 소프트웨어 툴킷에 대해 조금 이야기를 나누었습니다 서로 다른 인텔 하드웨어에 공통 API를 제공합니다 이 소프트웨어 툴킷은 OpenVino로 알려져 있습니다 열린 시각적 유추를 의미하는 및 신경망 최적화

OpenVino에는 세 가지 주요 구성 요소가 있습니다 첫 번째는 심층 학습 배포 키트 또는 DLDT입니다 두 번째는 OpenCV 및 미디어입니다 SDK는 전통적인 비전 및 비디오 처리에 사용됩니다 세 번째는 사전 훈련 된 모델 모음입니다

및 자습서 요약하면, OpenVino는 통합 프로그래밍 모델을 제공합니다 하드웨어 전반에 걸쳐 성능 및 메모리 최적화 사용자 정의 워크로드를 위해 확장 가능하며, 광범위한 운영 체제 지원을 제공하며, 단순한 out-of-the-box 경험을 위해 자체 완비되어 있으며, 커뮤니티가 기여할 수있는 오픈 소스입니다 향상시킬 수 있습니다 오늘 집중할 구성 요소 기본적으로 모델 최적화 프로그램을 제공하는 DLDT입니다 통합 API가있는 추론 엔진 다른 인텔 하드웨어를 통해

그래서 Intel과 Google은 파트너 관계를 맺고 있습니다 DLDT의 성능 및 사용 편의성 제공 Kubeflow에 DLDT 컨테이너를 추가하여 GCP 개발자에게 관로 데이터 과학자로서 엔드 투 엔드 솔루션을 만들고 있다고 가정 해보십시오 일부 의료 이미지를 기반으로합니다 여러 다른 컨테이너를 통해 작업을 수행 할 수 있습니다

데이터 처리, 데이터 변환, 데이터 검증 컨테이너는 데이터 읽기를 용이하게하며, 데이터를 예상 된 포맷으로 변환하는 단계, 사용 가능하고 적절히 라벨이 붙어있는 것으로 데이터를 검증하는 것 이 데이터는 강사 컨테이너로 전달됩니다 출력은 다음과 같은 모델 유효성 검사 컨테이너로 전달됩니다 모델을 배치하거나 게재 할 준비가되었는지 확인합니다 교육받은 모델은 최종 당사자가 제공하는 데 사용됩니다

OpenVino가이 흐름에 통합되는 방식 훈련 된 모델이 DLDT 모델 최적화 프로그램에 공급된다는 것입니다 모델 최적화 기는 최적화 된 IR을 생성합니다 그리고 나서 최적화 된 IR이 서빙 DLDT 컨테이너는 기본적으로 추론 엔진을 사용합니다 Intel 하드웨어에서 가능한 한 효율적으로 실행 백엔드 여기에는 Kubeflow 파이프 라인을 통합하는 몇 가지 예가 있습니다 OpenVino 컨테이너

여기에 제공된 링크에는 두 가지 예가 있습니다 그리고 우리는 당신이 앞서 가서이 예들을 시도하도록 초대합니다 이 컨테이너를 통합하는 흐름을 따라 가야합니다 Kubeflow 파이프 라인으로 OpenVino와 그 이점에 대해 더 많이 배울 수 있습니다

하단의 링크를 사용하십시오 또한, 제 동료들은 AI 파이프 라인 및 인텔 OpenVino 소개 웹 세미나 내가 격려하는 통합 너는 배우기 위해 지켜보아야한다 마무리하기 만하면됩니다 AI 개발자를위한 인텔 리소스에 대한 자세한 내용 인텔 AI 아카데미는 최고의 장소입니다 인텔 자산 및 도구에 대해 더 자세히 배우기 시작했습니다

AI 빌더스 솔루션 라이브러리는 훌륭한 원 스톱 매장입니다 인텔 AI 기술 기반 솔루션을 찾는 방법 다른 분야에서 인텔의 GCP 방문 페이지는 훌륭한 출발점입니다 GCP에서 활성화 된 인텔 기술에 대해 자세히 알아보십시오 그걸로 다시 한 번 감사드립니다

AI의 일부를 소개 할 기회 GCP의 기술 라이브 Q & A를 위해 계속 지켜봐주십시오 내 동료, Banu, 몇 가지 질문에 대답하는 데 도움이됩니다 우리는 1 분 안에 돌아올 것입니다 SHIDE SHAHIDI : 그래서 여기 나와 함께 Banu 있습니다 그리고 우리는 많은 질문에 답하려고 노력할 것입니다

우리가 할 수있는대로 관객으로부터 내가 이야기하는 동안 몇 가지 질문을 수집했습니다 Banu, 그래서 질문 여기에, "고객의 사례는 무엇입니까? AI에 Xeon을 사용합니까? " BANU NAGASUNDARAM : 정말 좋은 질문입니다 AI에는 많은 고객이 있습니다 두 기계 학습 모두에 제온 프로세서를 사용하는 사용자 그리고 깊은 학습 작업량

특히 인공 지능에 대한 깊은 학습에서, 두 가지 유형의 작업 부하가 있습니다 우리가 지원하는 추론과 훈련을 위해서 우리의 고객은 Xeon 확장형 프로세서, SkyLake CPU, 스트리밍 추론 및 배치 추론에 사용됩니다 최근 스트리밍 추론의 한 예 얘기 Taboola했다 웹을 제공하는 추천 엔진입니다

웹 서비스 응용 프로그램 용 또한 Xeon CPU를 사용하여 데이터를 가져옵니다 그것을 스트리밍하고 실시간 추론을한다 데이터에 또한 약 360 억 건의 권장 사항을 제공합니다

매월 10 억 명의 고유 사용자가 있습니다 이것이 스트리밍 추론의 한 예입니다 그리고 일괄 유추를 위해 우리는 GE Healthcare와 같은 고객은 이미지 인식 워크로드에 Xeon CPU를 사용합니다 그리고 그들의 업무량은 마약에 관한 것입니다 – 더 많은 CT 스캔 및 제약 관련 그리고 그들은 배치 추론을 위해 Xeon CPU를 사용합니다

데이터베이스가있는 경우, 수집 된 집합 데이터의 그리고 그들은 그것을 사용하여 큰 배치 크기로 추론을합니다 그리고 그들은 엄청난 양을 깨달았습니다 Xeon CPU를 사용하여 성능이 향상되었습니다 그런 다음 교육 워크로드도 제공합니다

우리는 제약 업계의 노바티스와 같은 회사를 보유하고 있습니다 기본적으로 높은 콘텐츠 심사를하고 있습니다 정말 큰 이미지 크기 벤치 마크 중 일부를 살펴보면 예를 들어 ResNet-50과 같이 사용하는 그들은 ImageNet 데이터베이스를 사용합니다 그리고 그것은 더 작은 이미지 세트입니다

그러나 실생활에서는 고객이 훨씬 더 큰 이미지 크기를 사용합니다 그리고 노바티스는 훈련에 대한 사례 중 하나입니다 그들은 시간의 개선을 달성했다 Xeon CPU를 사용하여 교육 및 처리량을 향상시킬 수 있습니다 그래서 그것들은 우리 고객의 몇 가지 예입니다

AI 용 Xeon SHAHH SHAHIDI : 나는 다음 질문의 종류가 암시한다고 생각한다 그뿐 아니라 다음 질문은 "Xeon에서도 교육을 실행할 수 있습니까?"입니다 그래서 우리는 추론에 대해 이야기 해 왔습니다 설정 방법 및 Xeon 및 GCP에서 사용하는 방법에 대해 설명합니다

교육을 진행중인 고객의 사례가 있습니까? 제온에요? 그것은 가능합니까? BANU NAGASUNDARAM : 맞아 네 그건 좋은 질문이야 따라서 제온 CPU는 다목적 CPU이며, 이는 다양한 작업 부하에 사용됩니다 그리고 깊은 학습은 하나의 부분 집합입니다

인텔에 매우 중요한 워크로드 중 우리의 고객 그 일환으로 Xeon CPU에 대한 교육을 실행할 수 있습니다 내가 암시 한 사례 중 하나는 노바티스 (Novartis)였다 그러나 내가 만질 수있는 몇 가지 다른 것들이 있습니다 예를 들어, HPC와 AI의 수렴에서, 우리는 고객을 위해 실행되는 작업 부하를 가지고 있습니다

엄청나게 큰 데이터베이스에 예제 중 하나는 – 최근에 우리는 Supercomputing 2018 컨퍼런스에서, 프랑스 연구 기관인 [INAUDIBLE] Xeon CPU를 사용하여 여러 CPU에서 교육을 확장 할 수있었습니다 128 노드, 확장 효율성 향상 필요한 정확성을 얻는 것입니다 그래서 이것은 어떻게, Xeon에서 교육을 실행할 수 있습니다 추가 하시겠습니까? SHAHIDI : 예

사실 사실 GCP에서, 우리는 제온 (Xeon)에 대한 교육을 받고있는 고객이 몇 명 있습니다 그들의 응용 프로그램은 시각 효과에서 건너갑니다 위성 이미지로 장바구니 실험실은 공개적으로 Xeon에 대한 교육을 받고 있다고 발표했습니다 실제로하고있는 몇 가지 다른 것들이 있습니다 GCP 환경에서 BANU NAGASUNDARAM : 좋습니다

네 내 마음에 온 또 다른 한 가지 예가 CERN이었습니다 그들은 대형 Hadron Collider를 사용합니다 그리고 그들은 수집하는 엄청난 양의 데이터를 가지고 있습니다 그리고 그들은 몬테카를로와 같은 고성능 컴퓨팅을 실행합니다

시뮬레이션을 할 수 있습니다 또한 분산 된 교육을 위해 Xeon CPU를 사용합니다 256 개 노드에 걸쳐 그리고 우리는 3D-GAN에 대한 한 예를 보여주었습니다 적대적인 네트워크가 생성되어 여러 Xeon 노드에서 효율을 높일 수 있습니다 SHAHIDI : 알았어요

승인 큰 그래서 보자 BANU NAGASUNDARAM : 다음 물어볼 수 있습니다 그래서 언제 "우리는 깊은 학습 향상에 접근 할 수 있습니까? GCP의 VNNI에? " SHIDE SHAHIDI : 좋습니다, 그래서 좋습니다

VNNI 지침 및 심화 학습 차세대 Intel Xeon CPU에서 사용할 수 있습니다 실제로 샘플을 고객에게 보내고 있습니다 올해 말에 GCP에서 사용할 수있을 때 실제로는 GCP 담당자를위한 질문 따라서 GCP 담당자와 연락하는 것이 좋습니다

언제 그들의 타임 라인을 알아 내기 위해 그들은 그들의 플랫폼에서 이것을 이용할 수있게 할 것입니다 그래서 나는 당신을 위해 하나를 가지고있다 사실, 마지막에 가자 먼저 그 질문에 대답하기를 바랍니다 그리고 나서 시간이 있다면, 우리는 이전 시간으로 돌아올 것입니다

그래서 "다른 토폴로지와 프레임 워크는 무엇인가? 인텔 하드웨어에 최적화되어 있습니까? " BANU NAGASUNDARAM : 그것은 좋은 것입니다 따라서 인텔 포트폴리오 슬라이드 다른 프레임 워크를 보여주었습니다 우리가 최적화 한 요약하면 TensorFlow는 주로 프레임 워크 최적화 그러나 그 외에도 MXnet도 사용합니다 Caffe, 너무

그런 다음 PyTorch와 PaddlePaddle 프레임 워크의 몇 가지 예입니다 우리가 최적화 할 수 있습니다 토폴로지 측면에서 우리는 다양한 토폴로지를 수행합니다 그리고 그들은 유스 케이스와 매우 관련이있다 우리 고객이 신청하고 있습니다

예를 들어 이미지 인식을 실행하고, 이것은 Resnet-50, Inception v3 예제와 같습니다 우리는 물체 감지를합니다 YOLO가 그 예입니다 우리는 이미지 분할을합니다 이미지의 특정 세그먼트를보고있다

그것은 Mask R-CNN과 같습니다 우리는 또한 신경 기계 인 언어 번역도합니다 번역 작업 부하 그리고 나서 마음에 떠오르는 다른 것들 중 일부 TTS (text-to-speech)입니다 WaveNet은 TTS (text-to-speech) 워크로드의 좋은 예이며, 심지어 권장 시스템 (예 : Wide & Deep 또는 신경 협동 필터링과 같습니다

기본적으로 토폴로지는 매우 다양합니다 이러한 다양한 프레임 워크에서 최적화 할 수 있습니다 SHAHIDI SHAHIDI : OK, 라이브러리 및 프리미티브뿐만 아니라 우리는 또한 프레임 워크를 가지고 있습니다 그리고 그것은 우리가 서로 다른 토폴로지로 작업하는 부분입니다 다른 작업 부하에서

아마 우리는 한 번 더 질문 할 시간이 있다고 생각합니다 "인텔 최적화 소프트웨어의 이점은 무엇입니까? 왜 내가 그것을 필요로합니까? " BANU NAGASUNDARAM : 좋은 질문입니다 [웃음] 나는 시작할 수 있고 그 다음에 그걸 추가 할 수 있습니다 SHIDE SHAHIDI : 물론입니다 BANU NAGASUNDARAM : 그래서 Shideh 오늘 너 얘기하고있다

우리가 할 수있는 다른 것들은 무엇입니까? 그러나 우리는 왜 그것을해야합니까? 예를 들어 Skylake와 같이 우리가 구축 한 하드웨어는 ADX-512 명령어가 있습니다 차세대 제온 CPU는 VNNI 지침이 있습니다 이 지침에서 성능을 얻으려면, 그 위에 개발 된 라이브러리가 필요합니다 이 지침을 사용하십시오 그리고 일단 당신이 그러한 라이브러리를 개발하게되면, 이러한 라이브러리를 호출하기위한 프레임 워크가 필요합니다

그래서 우리는 당신이 최신 버전이 필요하다고 말합니다 인텔 하드웨어에 최적화 된 소프트웨어 최상의 성능을 얻으려면 GCP를주고 싶니? SHACHH SHAHIDI : GCP와 거의 같은 것입니다 BANU NAGASUNDARAM : 좋습니다 승인 SHIDE SHAHIDI : 프레임 워크가있는 한 및 토폴로지를 사용할 수 있는지 확인하십시오

최신 버전을 사용하고 있는지 확인하십시오 하드웨어와 소프트웨어 중 가장 뛰어난 것입니다 시도 해봐 그리고 당신의 공연이 보일 것입니다 이점과 부스트

BANU NAGASUNDARAM : 맞아 SHAHH SHAHIDI : 그래서 생각, 우리는 닫을거야 다음 세션 소개를 위해 계속 지켜봐주십시오 인공 지능 허브, 모든 인공 지능을위한 원 스톱 카탈로그 고맙습니다

BANU NAGASUNDARAM : 감사합니다 [음악 재생]

Welcome to QuantumCasts! A new series on quantum computing

MARISSA GIUSTINA : 안녕하세요 나는 마리사 지 스티나이고, 나는 새로운 일련의 동영상을 소개합니다

양자 컴퓨터와 어떻게 프로그래밍 할 것인가 우리는 일련의 네 가지 비디오를 다루고 있습니다 우리가 즐길 수있을 거라 생각하는 개념의 폭 넓은 집합 나는 양자 계산이 실제로 무엇인지 설명 할 것이다 전통적인 컴퓨팅과는 다른 점이 있습니다

거기에 많은 서술들이 나와 있습니다 나는 그것을 본질적으로 끓일 것이다 양자 컴퓨터의 작동 원리와 사용법을 보여줍니다 다니엘은 차이점을 파헤 칠 것입니다 고전 정보와 양자 정보의 결합 육체적 인 수준에

전통적인 메모리에 대해 배우게됩니다 마이크로 전자 레벨에서 어떻게 작동하는지, 이를 바탕으로 양자 칩이 어떻게 작동하는지 확인하십시오 다음은 양자 컴퓨터 프로그래밍에 관한 것이며, 데이브가 그걸 다 말해 줄거야 양자 컴퓨터 프로그래밍의 개념과 프로그래밍이 아닙니다 새로운 오픈 소스 Cirq 언어 쉽게 해줍니다

마지막으로, 깊은 개념에 관심이 있다면 컴퓨터 과학 중 세르지오는 당신에게 대우를 제공합니다 그는 오랫동안 확고한 강자에 대해 이야기 할 것입니다 교회 – 튜링 논제와 양자 컴퓨팅이 제공하는 방식 한계로부터의 흥미 진진한 돌파구 전통적인 컴퓨팅의 이 동영상은 우리가 처음 접하는 동영상입니다 Google 개발자를 위해 제작하고 그 (것)들에 당신의 의견을 듣는 것을 사랑하십시오 나 또는 다른 발표자에게 질문이 있으시면, 아래 의견란에 남겨주세요

Developing a Warning System for Risk Managers from Scratch on GCP, using AI & ML (Cloud Next ’18)

[음악 재생] OTTO VERMEULEN : 혹시 궁금한 적이 있습니까? 은행이 돈을 안전하게 지키는 방법 은행이 신용 위험에 대해 모니터링하는 방법은 무엇입니까? 프리젠 테이션을 시작하기 전에 비즈니스 문제를 개략적으로 설명하는 짧은 애니메이션, 솔루션, 기술이 어떻게 도움이 될 수 있는지에 대해 설명합니다 찰스를 만나십시오

[비디오 재생] – 은행의 신용 리스크 관리자 인 Charles를 만나십시오 매일 Charles는 모니터링을 담당합니다 은행의 대출과 관련된 위험 다른 회사에 돈을 문제는 요즘 정보를 얻지 못하는 것입니다 올바른 정보

큰 데이터 세계는 Charles의 투쟁입니다 이 회사들에 관한 모든 뉴스를 읽는 것은 불가능합니다 종종 언어로 제공됩니다 찰스는 말하지 않는다 그리고 대부분이 단지 소음 일지라도 때로는 거기에 있습니다

정말 적절하고 긴급한 것입니다 현지 뉴스에서 언급했다 찰스가 더 잘 할 수있게 도와주는 것이 좋지 않을까요? 은행이 직면하고있는 신용 위험에 계속 머물니까? 이를 위해 조기 경보 시스템 (Early Warning System) 기계 학습 기반 응용 프로그램 모든 데이터를 처리하도록 훈련 된 사용할 수있게됩니다 조기 경보 시스템을 통해 Charles는 사전 신호를 얻습니다 그의 상대방에 대해서 그가 가지고있는 장치를 조사해야합니다

이 신호는 모든 지역 시장에서 발생합니다 그의 고객은 모든 언어로 활동합니다 조기 경보 시스템은 모든 것을 영어로 번역합니다 그래서 찰스는 이해합니다 이로 인해 많은 시간을 절약 할 수 있으며 빅 데이터에 생명을 불어 넣을 수 있습니다

세상이 훨씬 나아 조기 경보 시스템 [끝내기] OTTO VERMEULEN : 안녕하세요 내 이름은 Otto Vermeulen이며 PwC의 기술 파트너입니다 나는 Cloud Next '18에 이곳에 와서 매우 기쁩니다

우리가 본 것은 찰스의 주요 비즈니스 과제 적시에 적절한 정보를 얻고 있습니다 그의 문제가 해결 될 수 있다고 그가 전세계에서 정보를 얻는다면 적시에 그래서 우리는 신용 위험에 대한 조기 경보 시스템을 구축했습니다 조치– 공개 데이터에서 통찰력 추출 신용 위험을 가능케하는 전 세계에서 중요 이벤트에 집중하는 관리자 의사 결정을 지원합니다 그리고 어떻게 그리고 왜 지금 가능한가? 거의 무제한의 컴퓨팅 성능을 가지고 있기 때문에 가능합니다 클라우드의 스토리지 용량 등이 포함됩니다

Google은 다양한 API 및 알고리즘을 보유하고 있습니다 기계 학습을 위해 그리고 우리가 지금 민첩하게 일하기 때문에, 빠른 실험을 가능하게합니다 그래서 우리는 개념 증명을 할 수있었습니다 12 주 만에 나는 이제 당신을 의제를 통해 간단히 걸을 것이다

먼저, 팀을 소개하고 설명합니다 우리가 어떻게 함께했는지 그 후에 ING는 신용 위험에 대한 이러한 사용 사례가 관리는 그들에게 매우 중요합니다 그런 다음 우리는 우리의 접근법을 상세히 설명 할 것입니다 이 개념 증명과 그것의 디자인 그 다음에는 기술 솔루션에 대해 설명하고, 기술 데모 포함

그런 다음이 프로젝트의 핵심 테이크 어웨이를 마무리합니다 보시다시피, 우리는 3 개의 주요 당사자와 함께 있습니다 그들은 ING, Google 및 PwC입니다 그리고 어떻게 우리가 같이 왔습니까? 글쎄, 쉽다 – 구글이 우리에게 접근했다 ING는 실시간 뉴스를 수집 할 생각이 있음을 나타 냈습니다

신용 위험에 대한 해당 분석 수행 관리 부서 그리고 그들은 우리가 그 (것)들과 일하게 기꺼이 할 것이라는 점을, 물론, 우리는 그렇게 할 것입니다 그래서 우리는 빨리 데모를 만들었습니다 그리고 데모는 ING가 올바른 방향으로 가고 있다고 확신 시켰습니다 이것을 더 깊이 탐구 할 필요가있었습니다

그래서 그들은 우리에게이 개념 증명을 해달라고 요청했습니다 이제 다음 연사에게 넘겨주기 전에, 나는 팀을 소개 할 것이다 우선, 우리는 Anand Autar가 있습니다 아난드는이 프로젝트의 집행자입니다 RNG에서의 포트폴리오 관리 책임자

그는 또한이 프로젝트의 아버지이기도합니다 아난드 팀은 중역 후원사였으며, 5 명의 핵심 팀 구성원 및 30 명이 넘는 테스트 사용자가 있습니다 PwC에서 Pieter Verheijen이 있습니다 Pieter는이 프로젝트의 약혼자입니다 컨설팅 분야에서 은행 혁신 실천을 선도하고 있습니다

Pieter는 Peter, Peter Wiggers가 뒤따를 것입니다 그는 클라우드 토착 아키텍트이자 기술 리더입니다 그리고 그의 취미는 Kubernetes입니다 나중에 그것에 대해 더 많이 듣는다 또한 우리 팀에는 데이터 과학자, UX 디자이너, 및 프런트 엔드 디벨로퍼를 포함한다

그리고 나서 발표가 아니라 똑같이 중요한, Google의 Petra Stojanovic ING의 계정 관리자입니다 우리에게 엄청난 통찰력과 접근성을주었습니다 Google 내의 적절한 전문가에게 이제 애니메이션을 보았습니다 프로젝트와 팀에 대한 소개가있었습니다

그리고 Anand Autar에게 넘겨 줄 시간입니다 아난드, 너에게 ANAND AUTAR : 감사합니다 [박수 갈채] 다들 감사 해요 오토가 언급했듯이, 너는 나를 볼 수 있었다

이 프로젝트의 아버지로서, 나는 그것을 자랑스럽게 생각합니다 우리가 지금있는 곳 나는 조기 경보 시스템으로 시작했다 몇 년 전쯤 지금 ING에서 당신과 함께 할 수있게되어 매우 기쁩니다 오늘날의 기술로 무엇을 할 수 있습니다

우리는 도매 신용 위험 내에서 이것을 개발했습니다 관리 공간, 이는 우리가 집중한다는 것을 의미합니다 대기업과 같은 고객의 경우 은행, 보험 회사와 같은 금융 기관 및 국가 이 프로젝트를 개인적으로 정말로 흥미롭게 만드는 것은 무엇입니까? 나를 위해 그것은 사실 그것이 사실이다 위험 관리 공간에서도 우리는 혁신도하고 있습니다

ING의 전략과 함께 앞으로 한 발 앞서 나가려고 노력합니다 소개 영화에서 볼 수 있듯이, 우리는 요즘 많은 정보를 다루어야합니다 그리고 내가하려고하는 것은 실제로 왜 우리가이 모든 정보를 과부하로 시작했는지 설명하십시오 우리가 오늘 가지고있는 그렇게하기 위해, 나는 처음에 당신에게 신용 위험에 대해 설명하기 시작할 것입니다

관리는, 그리고 나는 실제로 신용의 근무일을 사용한 예제를 안내합니다 위험 관리자 신용 리스크 관리 란 무엇입니까? 그 질문에 대답하기 위해, 나는 실제로 돌아갈 것이다 은행 업무의 기본에 이르기까지 은행을 살펴 본다면 은행은 돈을 입금하고, 돈을 빌리고, 또는 한 곳에서 다른 곳으로 돈을 이체 할 수 있습니다

본질적으로, 우리는 단지 금융 서비스 회사입니다 그래서 개인으로서 은행에 돈을 입금하면, 은행은 실제로 그 돈을 빌려줄 것이다 돈이 필요한 고객에게 우리가 그렇게 할 때 우리는 실제로 위험을 감수합니다 그 위험을 신용 위험이라고합니다

고객에게 돈을 빌려주는 것은 위험합니다 우리는 고객이하지 않을 위험을 감수합니다 그 돈을 갚을 수 있어야합니다 즉, 그들은 고착 할 수 없을 것이다 은행에 대한 의무

이 그림을 아주 자세히 보면, 당신은 실제로 당신을 사적인 개인으로 보게 될 것입니다 또한 위험을 안고 있지만 은행에 그리고 그 결과로, 우리는 규제 대상입니다 따라서 우리는 많은 규칙과 규정을 준수해야합니다 당신 돈이 우리와 함께 안전한지 확인하십시오 적절한 전체 조기 경보가있는 시스템은 매우 중요합니다

이제 우리가 실제로 어떤 일이 일어나는지 살펴 보겠습니다 돈 빌려 우리가 위험을 평가하기 위해 무엇을 할 것인지, 우리는 많은 분석을 할 것입니다 우리는 회사의 재정 상태를 살펴볼 것입니다 우리는 회사의 경영진을 살펴볼 것입니다

그들이 실제로 고칠 수 있는지 여부 그들이 제시 한 전략에 거시 경제적 유형의 사건을 살펴볼 것입니다 대차 대조표, 순 수익률 회사의 등등 우리가 할 일은 실제로 이 모든 변수들을 우리는 신용 위험 모델을 호출합니다 이들은 우리가 내부적으로 개발 한 모델이며, 독립 당사자들에 의해 검증 된 은행 내에서 그리고 규제 당국에 의해 [무관심] 그래서 우리가이 모든 변수들을 입력 할 때, 우리는 위험 등급을 얻습니다

그리고 위험 등급은 모델의 산출량에 불과합니다 그리고 그것은 당신에게 위험의 분류를 제공합니다 그래서 ING에서는 숫자 코드를 사용합니다 하나는 매우 위험한 반면, 18은 매우 위험한 것입니다 외부 평가 기관도 실제로 동일한 작업을 수행합니다

그들은 매우 낮은 위험에 대해 AAA를 사용했으며, BBB 이상 매우 위험합니다 그래서 우리가 고객과 약혼했을 때 우리는 실제로 우리가 그것이 위험에 빠졌기 때문에 위험을 감수하려고합니다 식욕, 우리가 할 일은 우리가 시작하는거야 그 고객을 모니터링합니다 이는 우리가 실제로 거기 밖으로 어떤 신호가 있는지보기 시작 실제로 우리가 가질 수있는 잠재적 인 문제를 야기합니다

클라이언트는 앞으로 나아갈 것입니다 이것이 우리가 조기 경고 신호라고 부르는 것입니다 매일 매일 우리가 할 일은 우리는 뉴스, 시장 가격, 또한 중간 수치를 좋아한다 나는 당신에게 조기 경고의 많은 예를 줄 수있다 신호가 있지만 클라이언트 유형에 따라 상당히 다릅니다

및 업계 유형별 그래서 내가해야 할 일은 위험의 날을 지나갈 뿐이야 매니저 그럼 찰스를 만나자 사실, 그는 거의 같은 사람입니다

소개 영화에서 그렇듯이 그렇다 머리 색깔이 다르다 Charles는 신용 리스크 관리자입니다 전 세계적으로 100 개의 고객 포트폴리오를 보유하고있는 유효한 그는 약 10 년 동안 은행에있었습니다

그는 아주 노련한 은행가입니다 그래서 그는 실제로 육감을 발전 시켰습니다 그가 실제로 거래를보고있을 때 실제로 알려줍니다 그것은 좋은 위험이든 나쁜 위험이든간에 그리고 거기에있는 모든 신용 리스크 관리자와 함께, 우리는 어떤 종류의 놀라움을 좋아하지 않습니다

그래서 Charles의 날을 보겠습니다 우선, 그는 사무실에 들어갑니다 그는 한 잔의 커피를 잡고 그의 보행 거리를 지납니다 기본적으로, 그는 위험을 본다 그의 포트폴리오와 관련이있는 뉴스를 의미합니다

그리고 나서, 그는 또한 모든 거래를 수행합니다 그래서 그는 그가 승인해야하는 거래를 봅니다 그가 거부할지 여부 그는 연례 리뷰를 봅니다 그리고 그는 등급 모델도 살펴 봅니다

그래서 Charles는 꽤 바쁜 하루였습니다 그리고 그날, 그는 또한 거기서 모든 신호와 정보를 포착했다고 그의 100 고객을 위해 자, 다음을 상상해 봅시다 어느 날 Charles는 실제로 신문을 읽고 있습니다 세계적인 신문

그리고 그의 고객 중 한 명이 아주 특정한 나라의 뇌물 수수 사건에 연루되어있다 그가 그들에 대해 몰랐기 때문에 그를 놀래줍니다 위험 관리자이기 때문에 그는 더 깊은 곳에서 파기 시작합니다 그리고 나서 그는 실제로,이 정보를 발견합니다 한 달 전에 이미 사용할 수 있었지만 매우 구체적인 국가와 매우 구체적인 언어

더 깊게 파고 들자 그는 실제로 주가가 떨어지고있다 한 달 동안 10 %를 받았다 그는 그 사실을 몰랐다 당신이 상상할 수 있듯이, Charles is being 놀라움을 좋아하지 않는 사람, 그는 매우 화가났습니다 이제 다른 예를 살펴 보겠습니다

Lauren을 만나십시오 Lauren도 신용 리스크 관리자이지만 은행의 경우 및 국가를 위해 그리고 그녀의 포트폴리오는 사실 훨씬 더 기어드입니다 시장 기반 유형의 가격으로 좋아요, 고마워요 지금 제 말을들을 수 있기를 바랍니다

글쎄, 사실 그것이 의미하는 바는 로렌 해당 고객의 위험 등급 프로필 방금 조정할 필요가 있습니다 음, 실제로, 그녀는 뉴스 하루 전 이미 이용 가능했습니다 외부 신용 평가 기관이 해당 국가를 등급 하향 조정했다 찰스처럼, 그녀는별로 행복하지 않습니다 Lauren과 Charles는 공통점이 무엇입니까? 음, 기본적으로 그들은 많은 정보를 다루어야합니다

그들은 정규 업무를해야합니다 당신이보아야한다고 상상해보십시오 당신은 2,000 전 세계 75 개 언어로 된 거래 상대방 당신이 필요로하는 20,000 가지 이상의 자료들 – 당신이 정보를 얻는다는 것 에서 그게 많이 있습니다 따라서 조기 경보 신호를 잃을 위험이 있습니다

따라서 우리는 도매 위험 내에서이 문제를 확인했습니다 관리 공간을 확보하고 실제로 큰 범위의 정보를 제공합니다 리스크 관리자와 관련된 뉴스 시장 데이터 따라서 우리는 실제로 더 빠르게 움직이고 이러한 신호를 잡을 수 있습니다 리스크 관리 부서로서보다 능동적이어야한다

우리가 지속적으로 모니터링하는 것으로 이동 뼈대 따라서 현재 구축 된 툴은 실제로 첫 번째 단계입니다 그것은 글로벌 및 지역 뉴스 감정을 가지고 있습니다 그것은 주식, CDS, 상품 가격, 국가, 조직 및 부문에 적합합니다 사용자는 실제로 자체 임계 값 레벨을 설정할 수 있습니다

그리고 뭔가에 도달하면 도구가 실제로 사용자에게 신호를 보내거나 알림을 보냅니다 우리에게는 항상 첫 번째 단계입니다 왜냐하면 우리는 항상 우리가이 프로젝트를 시작할 때 예상했다 우리는 훨씬 더 예측 가능한 도구를 원합니다 찰스와 얘기했던 여섯 번째 감각을 기억하니? 찰스,이 여섯 번째 감각은 그는 휴리스틱 스일 뿐이다

수년에 걸쳐 개발되었습니다 그리고 우리는 현재의 데이터로 사용할 수 있지만 기존 기계 및 미래 기계에도 사용할 수 있습니다 밖에있는 학습 기술, 우리는 훨씬 더 예측 가능한 도구를 만들 수 있습니다 그런데 왜 우리는 처음부터 그것을 만들었습니까? 우리는 ING로서 데이터 회사입니다 그리고 우리는 그것이 많은 장점을 가지고 있다고 생각합니다

이러한 종류의 응용 프로그램을 직접 제작할 수 있습니다 우선, 오늘날의 세계에서는 비교적 쉽습니다 이 도구들을 아주 빨리 만들 수 있습니다 매우 구체적인 사용 사례입니다 둘째로, 이는 많은 유연성을 제공합니다

또한 다른 솔루션 제공 업체로부터 독립적이기 때문에, 실제로 많은 기능을 제공합니다 당신은 종종 필요하지 않습니다 우리가 ING로서, 우리 자신의 운명의 주인이되고 싶다 우리는 실제로 이러한 유형의 도구를 만들 수 있음을 입증했습니다 우리 스스로

그래서 우리가 실제로 파트너가되는 이유입니다 Google 및 PwC와 함께이 도구를 구축하십시오 우리는 이제 무대에 서 있습니다 우리는 30 명의 사용자가있는 8 개국에서이 도구를 테스트했습니다 이제 우리는 다음 단계를 결정할 것입니다

이 도구를 더 개발하는 데있어 더 중요한 것은, 핵심 모니터링 프로세스에 임베드 앞으로 그래서 나는 왜 당신이 더 나은 느낌을 갖기를 바랍니다 우리는 도구가 있어야하지만 그 신용 위험 관리는 매우 데이터 중심적이며 은행 내에서 매우 분석적인 기능 음, 그걸로, 당신의 관심에 감사드립니다 미안합니다

관심을 가져 주셔서 감사합니다 그리고 나는 그것을 오토에게 돌려 줄 것이다 [박수 갈채] OTTO VERMEULEN : 감사합니다, 아난드 그것은 매우 분명했습니다 나는 우리가 은행이하는 일을 지금 알고 있다고 생각한다

그리고 신용 리스크 관리가 그들에게 매우 중요하다는 것 또한 개념 증명이라는 말을 듣기 좋습니다 조기 경보 신호를 받았다 도전과 또한 당신이 찾고 있습니다 더 예측적인 신호를 얻기 위해 기계 학습을 사용합니다 이제는 프로젝트에 대해 듣는 시간이라고 생각합니다

진화 된 디자인 원칙은 무엇 이었는가? 그래서 Pieter Verheijen에게 안녕, 모두 여기 와서 너와 대화하는 것이 좋다 우리의 개념 증명에 대해서 개인적으로, 나는 매우 열정적이다

중요한 문제 및 혁신을 실제로 발생시킵니다 그리고 나는 내 입장에 서서 당신을 그 길로 인도 할 것입니다 우리가이 개념 증명에 적용한 것입니다 둘째,이 솔루션의 설계와 근원적 인 비즈니스 요구; 셋째, 나는 너에게 줄 것이다 솔루션 자체의 데모

첫 번째 부분부터 시작하여, 접근법은 – 나를 위해, 세 가지 중요한 성분이있다 이 증명 개념의 일부였습니다 첫 번째 팀입니다 올바른 기술과 사람이 필요합니다 빠른 배달

우리의 경우에는 5 가지 기술 세트를 만들었습니다 IT 설계자; 사용자 경험 디자이너; 디자인을 구현하는 사용자 인터페이스 개발자; 데이터 과학자들은 모델을 구축하고, 조기 경보를 탐지한다 신호; 아난드의 신용 리스크 전문 지식 그리고 그의 팀은 실제로 우리에게 무엇이 관련이 있는지를 알려주고 있습니다 그런 팀을 만들면서 얻은 교훈은 당신이 필요로하는 것입니다 올바른 균형을 찾으려면 – 매우 빨리 전달할 수있는 전문가의 균형 자신의 전문 분야 에서뿐만 아니라 기술 겹쳐서 결국에는 함께 맞는 해결책

두 번째 요소는 일하는 방식이었습니다 우리는 직접적인 사용자 피드백을 통해 이익을 얻고있었습니다 항상 우리는 민첩한 업무 방식을 적용했습니다 그리고 우리는 오직 데모로 시작했습니다

최종 사용자에게 표시되는 2 주 후에 구축됩니다 그리고 그 접근 방식을 토대로 우리는 매우 귀중한 피드백을 얻었습니다 그리고 당신이 만들 수있는 대화 나머지 프로젝트는 우리는 그 피드백을 우리의 백 로그에 넣었습니다 첫 번째 프린트를 계획하고 그 순간부터 에, 우리가 최종 사용자와 함께 일할 수있는 리듬이있었습니다 연방

세 번째 요소가 범위 지정되었습니다 우리는 처음에는 공개 데이터 만 사용했습니다 그리고 그것은 속도를 엄청나게 증가 시켰습니다 우리는 기존의 다른 어떤 곳과도 연결할 필요가 없었습니다 그 시점에 은행 내의 IT 시스템, 그것은 우리에게 매우 중요했습니다

이제 우리가 적용한 접근법 높은 단계에서 3 단계를 거쳤습니다 첫 단계는 실제로 시작이었습니다 우리가 처음부터 시작할 필요가있을 때 Google Cloud Platform 환경에는 아무 것도 없습니다 그냥 프로젝트 이름

그런 다음 세 가지 성분으로 시작했습니다 내가 방금 설명하고 서비스와 함께 Google Cloud Platform에서 사용 가능 스프린트에서 솔루션을 개발할 수 있습니다 성공 요인은 우리는 스프린트마다 성공적으로 데모를했다 6 스프린트가 끝나면 그 당시에 사용자 테스트를 위해 준비된 개념 증명 우리의 경우, 이것은 나를 위해 힘을 실증했습니다

당신은 구글과 함께 개념의 증거를 구축에서 얻을 구름, 정말로 갈 수 있어요 당신의 개념 증명으로 빨리 우리의 경우, 그것은 성공적인 개념 증명이었습니다 그래서 우리는 계속 전진하기로 결정했다 그리고 두 번째 단계는 사용자와 함께 테스트하는 것입니다

아난드 (Anand)는 30 명 정도의 사용자가 8 곳 있다고 설명했다 그리고 이러한 사용자 조종사를 통해 많은 피드백과 데이터를 모았습니다 기계 학습을위한 모델을 재교육하는 데 사용할 수있는 관점과 실제로 무엇을 결정 관련 사용자에게 표시됩니다 그리고 이제, 우리는 세 번째 단계에 있습니다 여기서 우리는 이것을 어떻게 전개 할 것인지를 결정하고 있습니다

이것은 은행의 핵심 프로세스로 생산에 이제 이것이 우리가이 증명 개념을 어떻게 수행했는지에 대한 접근이었습니다 이제, 빨리, 나는 우리가 정확히 무엇을 만들 었는지를 알고 싶습니다 이것은 우리 솔루션의 매우 단순한 표현입니다 하단에는 두 가지 유형의 데이터 소스가 표시됩니다

우리가 섭취하는 첫째, 주식 가격면에서 시장 데이터, 신용 불이행 스왑, 채권 및 기타 금융 상품 톰슨 로이터 기반 ING가 가지고있는 면허증; 둘째, Google을 통해 공개 소스에서 오는 소식, GDELT 및 기타 Google Cloud Platform에 업로드 한 내용입니다 그것을 섭취하고 거기에 파이프 라인을 만들었습니다 해당 정보를 처리 및 분석합니다 그리고 그 중간 계층은 기계 학습을하는 곳이기도합니다 이 일어나고있다

그 파이프 라인을 기반으로 누가 사용자에게 표시할지 결정 인터페이스에 로그인 할 수 있으며, 그에게 그 정보를 얻으십시오 오른쪽에서 몇 가지 통계를 볼 수 있습니다 우리가 실제로 처리하는 것의 현재 범위는 약 250 개의 클라이언트 또는 조직입니다 도구에서 정보량에 대한 인상을 얻을 수 있습니다

우리는 매일 처리하고 있습니다 자, 그것은 아주 단순한 그림이었습니다 실제로, 그 지문을 통해, 우리는 매우 구체적인 비즈니스를 만났습니다 우리가 성취하고 완성해야 할 필요성 성공적인 개념 증명 다섯 명이 거리에 있습니다

시그널로 전달되는 최대 커버리지가 필요합니다 풍부한 정보로 실시간 그래서 당신은 그들의 주장이 옳다는 것을 확신합니다 관련성을 기준으로 필터링되고 순위가 지정되며, 그런 다음 결국 단일 이벤트로 클러스터됩니다 그리고 나는 더 많은 사람들을 통해 갈 것입니다 오는 슬라이드의 세부 사항

첫 번째 부분은 적용 범위입니다 엔티티 프로파일이 적용 범위를 결정한다는 사실을 실제로 배웠습니다 우리가 찾고 있던 첫 번째 데모 중 하나에서 우리는 실제로 우리가 놓친 의견을 얻었다 중요한 정보에 그리고 Anand가 설명했듯이, 당신은 원하지 않습니다

그 신호를 놓치지 마라 정보를 놓친 이유 우리가 부모와 만 정보를 찾고 있다는 것이 었습니다 회사 이름 실제로, 우리는 우리가 다른 접근법을 취하십시오 모든 별칭을 가진 엔티티 프로필을 만들어야합니다

다른 언어로 된 해당 회사의 자회사, ING의 예로서 여기에서 볼 수 있습니다 그리고 그런 식으로 우리는 보험 범위를 늘릴 수있었습니다 각 클라이언트에 대해 평균 5 배에서 10 배까지 증가합니다 이제 그 정보가 들어옵니다 실시간으로 처리하려고합니다

이것이 리스크 관리자의 핵심 요구 사항입니다 그래서 그는 그 신호를 빨리 얻고 응답 할 수 있습니다 여기에서 볼 수 있듯이 평균 위험 50 명의 고객 포트폴리오를 가진 관리자, 그건 상당히 많은 정보입니다 우리가 처리해야 할 매일 매일 15,000 개의 뉴스 항목에 대해 이야기합니다 지속적으로 움직이는 250 개의 금융 상품, 그게 우리가 있어야 할 모든 것입니다

실시간으로 처리 할 수 ​​있습니다 그러면 우리는 어떻게 위험 관리자를 도울 수 있습니까? 이 일들 위에 머무를 수 있을까요? Peter가 한 기술적 인 부분에서, 우리는 건축과 길에 대해 이야기 할 것입니다 우리는 이것을 만들기위한 해결책을 개발했습니다 이 요구 사항을 충족시킵니다 세 번째는 풍요 다

그래서 위험 관리자로서, 당신은 실제로 진정으로 조직에 관한 정보를 원합니다 당신이 책임 져야합니다 따라서 오탐 (false positive)을 제거 할 수 있어야합니다 예를 들어 여기에 나와있는 것처럼 평균 뉴스 항목이있는 경우, 당신은 뉴스 항목에서 언급 된 많은 배우들을 볼 수 있습니다 그래서 키워드 검색을한다면 어떤 조직이라도이 항목은 채찍질을합니다

그러나 조기 경보 신호를 찾고 있다면, 석유 회사 E의 경우에만, 이것은 진정한 긍정적 조기 경보 신호입니다 나머지는 단지 거짓 긍정적입니다 당신은 그것들을 걸러 내고 싶습니다 그래서 우리는 키워드 방법을 뛰어 넘을 필요가 있습니다 누가, 무엇을, 언제, 어떻게, 그리고이 사건이 실제로 일어나고있는 곳

그리고 우리는 자연어 처리 기술을 사용합니다 나중에 어떻게 작동하는지 보여 드리겠습니다 네 번째 부분은 이제 매우 광범위하게 진행되었습니다 많은 정보가 들어오고 있습니다 우리는 또한 그것을 풍부하게했습니다

그래서 그것은이 거래 상대방 또는 고객에 관한 것입니다 하지만 지금은 처리해야 할 정보가 너무 많습니다 따라서 해당 정보를 필터링 할 수 있어야합니다 신용에 실제로 관련된 항목을 선택하십시오 위험 관리자가 살펴보아야합니다

여기에서 볼 수 있듯이 네가 원하지 않는 것들의 몇 가지 예 위험 관리자로서의 모습 따라서 은행 모니터링에 대한 책임이있는 경우 당신은 글로벌 뉴스를 받고 있습니다 ATM 사고에 관한 지역 뉴스가 많이 있습니다 예를 들어 – 부정적 정서는 있지만 신용 위험에는 관련이 없다 그 수준의 매니저

자동차 제조 업체와 동일합니다 자동차 사고에 대한 소식도 얻으십시오 그래서 우리가해야 할 일은 실제로 우리 파이프 라인에서 그 구별은 어떤 유형의 주제를 탐지하는지 신용 리스크 관리자와 관련있다 다른 부분을보고 잘라내는 것입니다 노이즈 프레임

그리고 네 번째 – 또는 미안합니다 – 다섯 번째는 클러스터링입니다 이제는 관련 항목을 살펴 보겠습니다 그러나 당신이 상상할 수있는 것처럼, 그러한 사건이 발생하면, 더 많은 게시자가 그것에 대해 글을 남겼습니다 그리고 그것은 사용자에게 매우 짜증나는 경험이됩니다 너는 그 같은 뉴스 메시지를 받기 때문에 계속해서 또 다른 뉴스에서 발행자

따라서 이것을 해결하기 위해해야 ​​할 일은 클러스터링을 구축하는 것입니다 실제로 텍스트를 기반으로하는 것을 이해하는 알고리즘, 이것은 동일한 사건에 대해 이야기하고 있습니다 그리고 그것이 우리가 한 일입니다 그래서 당신은 그것을 클러스터링합니다 하나의 이벤트에 넣고 그 메시지를 한 번 가져 오십시오

사용자에게 이제 이들은 우리 솔루션의 다섯 가지 기본 요소입니다 내가하고 싶은 마지막 일 지금 솔루션의 데모를 안내해드립니다 정말 생겼어 데모의 목적 상, 우리는 여기 방에있는 누군가를 해치고 싶다 실제 조기 경고 신호

그래서 시뮬레이션 데이터 세트를 만들었습니다 더미 이름과 더미 뉴스 항목 도구의 나머지 부분은 그대로 작동합니다 이제 Charles가 로그인했습니다 보시다시피 아직 그의 홈 페이지에는 아무 것도 없습니다

따라서 그가하는 첫 번째 일은 자신의 포트폴리오로 이동하는 것입니다 그는 거래 상대방을 추가하려고합니다 자신의 조직에 – 목록,하지만 당신은 또한 이름 검색을 시작하십시오 그래서 그게 그가 지금하고있는 일입니다 그리고 그는 두 번째 조직을 추가합니다

자신의 포트폴리오, 세 번째 조직 및 네 번째 조직 이제 그는 자신의 포트폴리오에 네 개의 조직을두고 있습니다 네, 저기 있습니다 그런 다음 그는 왼쪽 상단을 클릭하여 홈 페이지로 돌아갑니다 화면 왼쪽에는 뉴스 피드가 표시됩니다

그리고 뉴스 피드에는 정서 점수, 날짜, 엔티티를 찾았습니다 또한 기간별로 필터링 할 수도 있습니다 다양한 요인에 대한 뉴스를 필터링 할 수 있습니다 관련성이나 정서성과 같은 또는 인기를 의미합니다 그런 다음 여기에서 특정 기사로 이동한다는 것을 알 수 있습니다

비슷한 항목이 다섯 개 있습니다 그것이 클러스터링입니다 따라서 이들은 모두 다른 언어로 된 동일한 사건에 관한 것입니다 다른 제목으로 그래서 이것은 제 생각에 중국의 프랑스 기사입니다

FR은 프랑스어로 번역 된 다음 그 하나의 사건으로 오른쪽에서 시장 정보를 볼 수 있습니다 주식 가격 그래서 첫 번째 것은 부정적인 것입니다 그래서 내려 갔다 그래서 그는이 특정 거래 상대방 페이지를 살펴 봅니다

우리는 훨씬 더 자세한 정보를 가지고있었습니다 주식 가격, 신용 디폴트 스왑, 신용 등급 그러나 실제로 이것은 모두 매우 민감합니다 가서 정보를 찾아야합니다 그러나 당신이 할 수있는 일은 거기에 트리거를 설정하는 것입니다

그것을 사전 행동으로 만듭니다 주식 가격이 하루에 5 % 하락한다고 가정 해 봅시다 그게 그가 지금하고있는 일입니다 그는 자신의 포트폴리오에 그것을 추가합니다 그는 키워드와 같은 일을 할 수 있습니다

사기의 경우, 예를 들어, 사기가있는 뉴스 항목, 내가 원한다 즉시 통보 받는다 그게 방아쇠가하는 일입니다 이제 백그라운드에서 이미 실행 중입니다 트리거 된 트리거가 있는지 확인합니다

새로운 감정은 매우 부정적입니다 또 다른 방아쇠 신용 등급 – 아마도 다운 그레이드, 그게 너야 즉시 통보 받기를 원한다 그리고 이런 식으로 매우 적극적인 방법이됩니다

이제는 그 정보를 얻는 것이 당신을 찾고 그 정보가 너에게 간다 이미 사기가 발생했습니다 그래서 사기에 관한 기사가있었습니다 이 특정 클라이언트에 보세요

예, 있습니다 그리고 지금, 내 감정 점수는 70이므로 상대적으로 높습니다 이제 사용자는 특정 항목에 대한 피드백을 제공합니다 나는 그것에 대해 더 알고 싶다 또는 예를 들어, 두 번째는 관련성을 고려하지 않습니다

이것이 실제로 우리가 사용할 수있는 정보입니다 백그라운드에서 실행중인 모델 기계 학습으로 발전했습니다 그래서 그것은 매우 짧은 데모 였지만 그것이 우리에게 능력 있고 실제로 신용 위험을위한 디지털 비서를 만드는 방법 그의 일을 훨씬 더 쉽게하기 위해 매니저 적용 범위가 증가하고 응답 시간이 증가하며, 그리고 결국에는 능동적 인 도구를 통해 그 정보는 적시에 그에게옵니다 그걸로 너에게 감사하고 오토에게 손을 내밀어 [박수 갈채] OTTO VERMEULEN : 감사합니다, Pieter, 어떻게 우리가 프로젝트에 접근하는 방식을 설명합니다

너는 그렇게 잘했다 또한 사업 개요를 알려 주셔서 감사합니다 우리가 필요로했던 개념들 이제는 우리가 이 프로젝트의 기술 세부 사항 중 일부에 뛰어 들어라 뼈에 기술적 인 고기를 보여주기 위해서

무대에 서기를 원해요, 피터 위거스 Peter Wiggers : 제 이름은 Peter Wiggers입니다 저는 클라우드 아키텍트이자 소프트웨어 중 하나입니다 이 도구의 개발자 그리고이 프리젠 테이션을하고 싶습니다 조금 더 기술적 인

그래서 그 일을하게되어 정말 기쁩니다 나는 네가 또한 있기를 희망한다 먼저 회로도 개요부터 살펴 보겠습니다 슬라이드로 다시 전환 할 수 있습니까? 네, 고마워요 여기에서 볼 수있는 것은 도식 개요입니다

우리가 Google Cloud에 구축 한 솔루션의 보시다시피, 우리는 많은 관리 된 Google Cloud를 사용합니다 서비스, ​​정말 우리가 빨리 개발할 수 있습니다 왼쪽에는 파이프 라인에 사용 된 입력이 표시됩니다 당신은 오른쪽에서 볼 수 있습니다 따라서 입력은 엔티티 프로파일 러로 구성됩니다

뉴스에 대한 공개 데이터 소스로 구성됩니다 오른쪽에는 우리가 만든 파이프 라인이 있습니다 그리고 당신이 볼 수 있듯이, 그것은 주로 두 가지 매우 중요한 구성 요소 중 하나입니다 그 중 하나가 Google Cloud Pub / Sub이고 그 중 하나 Google Kubernetes Engine입니다 이 조합은이 파이프 라인이 정말 견고하다는 것을 확인했습니다

그러나 여전히 매우 유연합니다 그리고 데모에서 왜 나중에 표시할까요? 이 파이프 라인은 두 단계로 구분됩니다 그리고 모든 단계는 자체 Kubernetes 배포입니다 그래서 우리는 그것을 독립적으로 쉽게 확장 할 수있었습니다 다른 Kubernetes 배치에서

모든 배포는 Pub / Sub를 통해 통신합니다 따라서 입력은 Pub / Sub에서 나오며 출력은 처리 및 기사가 끝날 때까지 Pub / Sub로 이동합니다 이제 제가하고 싶은 것은 데모로 전환하십시오 나는 당신을 기사의 여행에 데려 가고 싶다 파이프 라인을 통해

그리고 우리는 Jupyter 노트북에서 이것을 할 것입니다 나는 당신이 뒤에서 그것을 읽을 수 있기를 바랍니다 그리고 우리가 할 일은 엔티티를 만드는 것으로 시작하는 것입니다 윤곽 이 경우 PwC를 사용하게됩니다

그것은 입력으로 사용하는 유일한 키워드입니다 그리고 엔티티 프로파일의 일부만 빌드 할 것입니다 이 엔티티의 별칭 및 Wikipedia 페이지를 수집 중입니다 그래서 우리는 이것을 실행할 것입니다 보시다시피, 우리는 꽤 많은 별명을 발견합니다

다른 언어로 된 일부 자회사, 다른 문자 세트, 다른 이름 그리고이 별칭을 모두 사용하여 검색합니다 이 회사에 대한 소식입니다 당신도 볼 수있는 것은 위키피디아 식별자의 몇 가지입니다 이것들은 나중 단계에서 우리에게 정말로 중요합니다

이제 우리가 할 일은 별칭 중 하나를 사용하는 것입니다 이 경우 숫자 5는 PwC입니다 우리가하는 일은 RSS 피드 URL을 생성하는 것입니다 Google 뉴스 보시다시피 검색어로 사용했습니다

이 RSS 피드 또한 특정 에디션에 대한 쿼리도 제공됩니다 Google 뉴스의 버전은 언어와 국가의 그래서이 경우에는 프랑스 기사가 될 것입니다 벨기에에서 작성되었습니다 이 예에서는 Google 뉴스 RSS 피드 하나를 쿼리하고, 우리는 단 하나의 판, 네덜란드 판입니다

그래서 우리가 할 일은 우리가 피드를 파싱하는 것입니다 우리는 먹이를 얻는다 그리고 여기서 보시는 것은 처음 다섯 기사입니다 이 RSS 피드 그것은 네덜란드어로, 아마 당신은 그것을 이해할 수 없을 것입니다, 그러나 그것은 나중에 올 것이다

RSS 피드에서 얻은 정보는 헤드 라인입니다 게시 날짜 및 원래 기사의 URL입니다 이것은 Pub / Sub가 들어오는 첫 번째 부분입니다 그 전에는 우리가 시작해야하기 때문에 우리가 치료로 시작하는 순간에 파이프 라인이 있습니다 그리고 치료법은 이전 슬라이드에있었습니다

치유가 주기적으로하는 일은 Pub / Sub에 작업을 게시합니다 Google 뉴스에서 Dutch Edition의 PwC에 대해 문의 할 수 있습니까? 이제 끝났습니다 우리가 지금하는 일은이 RSS에서 얻는 모든 기사에 대한 것입니다 피드, 우리는 Pub / Sub에 작업을 게시합니다 이봐, 이 기사를 처리 할 수 ​​있습니까? 그리고 우리에게는 다른 노동자들이 있습니다

이 Pub / Sub 주제를 듣고, 작업을 가져 와서 처리하십시오 따라서이 방법만큼이나 간단합니다 특정 주제를 게시하기 만하면됩니다 해당 주제 내의 특정 구독을 구독합니다 지금 당신에게 보여주고 싶은 것은 통계입니다

그래서 우리는 이것을 열 것입니다 여기서 볼 수있는 것은 Pub / Sub의 일부 측정 항목입니다 첫 번째 차트에서 얼마나 많은 메시지가 Pub / Sub에 게시합니다 이 경우에, 그것은 거의 전부입니다 한 순간에 초당 2,000 개라고 생각합니다

그리고 우리는 몇 분 정도 그것을 할 것입니다 기사의 Pub / Sub의 전체 대기열로 연결됩니다 200,000 개의 기사를 처리하는 것은 중복 될 수 있습니다 여기서 전체 대기열을 볼 수 있습니다 그리고 당신이 여기에서 보는 것은 금액입니다

기사의, 노동자의 과정 그래서 그것은 약 30,000 건에 관한 것입니다 5 분입니다 따라서 30 분 동안 전체 대기열을 처리합니다 그리고 나서 우리는 단지 기다려야합니다

우리는 다시 그 실체들을 검색합니다 그리고 이것은 가장 오래된 것의 나이를 보여주는 그래프입니다 작업을이 Pub / Sub 대기열에 저장하므로 약 2,600 초입니다 나도 몰라, 그게 나는 그것이 40 분이라고 생각한다 그리고이 설정이 정말 좋은 이유는 무엇입니까? 우리가 노동자들을 독립적으로 확장 할 수 있다는 것입니다 그래서 이것이 너무 길다고 생각해 봅시다 무언가가 발생하면 40 분을 기다리는 것을 원하지 않습니다 나는 그것을 더 빨리 알고 싶다

그렇다면 우리는 말할 수 있습니다 좋습니다 독립적으로 노동자 예를 들어 두 배로 늘립니다 의 근로자

그리고 나서,이 숫자,이 30,000, 60,000으로 증가합니다 대기열은 처리되며 시간은 반으로 줄어 듭니다 그래서 이것이 얼마나 쉬운지를 보여주고 싶습니다 첫째, 나는 너를 얼마나 많이 알고 싶은가? Kubernetes에 대한 직접 경험이 있습니까? 그래 그거 괜찮다 그것은 꽤 많은 것이다

Kubernetes 배포를 확장하는 방법을 알고있을 것입니다 그렇지 않은 사람들을 위해 그것이 얼마나 쉬운지를 보여줍니다 그러니 조금 확대 해 보겠습니다 여기서 우리가하는 일은 기사의 첫 번째 부분 인 진행중인 작업자입니다 12 컨테이너 나 12 봇 같아

그래서 우리가하고 싶은 것은 그것을 확장하고 싶습니다 따라서 우리는이 30 분 처리 시간에 만족하지 않습니다 그럼 우리가 할 일은 거기에 정확하게 입력하겠습니다 그래서 여기에 우리는 12 개의 복제물을 돌리고 싶다고 말합니다 그럼 우리가 18 세가되면 따라서 50 % 더 많은 봇이 실행됩니다 그렇다면 바로 지금 Kubernetes가 보입니다 더 많은 컨테이너를 생성합니다

그리고 그들은 이미 지금 달리고 있습니다 그리고 그들은 같은 Pub / Sub 토픽을 듣습니다 그래서 Pub / Sub는 작업이 배포되었는지 확인합니다 이 컨테이너 위에 그래서 우리가 지금 기다리는다면, 나는 생각한다

2 분이 지나면 파이프 라인이 다시 시작됩니다 이 막대는 5 분에 45,000 개가 될 것입니다 따라서 이것을 확장하는 것이 쉽습니다 그럼이 기사가 프로세서에 도착했다고 가정 해 봅시다 그런 다음 새 기사를 인스턴스화합니다

우리는 RSS 피드에 있던 것과 동일한 정보를 가지고 있습니다 정보가 Pub / Sub로 전송되었으므로, 우리는 Pub / Sub에서이 정보를 얻습니다 그래서 여기에 추가 된 것은 없습니다 그냥 URL입니다 원본 제목이 원본입니다

및 게시 날짜 이제 우리는 작업자에게 작업을 제공합니다 웹 사이트를 방문하여 시신을 수집하는 것 웹 사이트에서 당신이 여기에서 보는 것은 기사의 본문입니다 네덜란드어로되어있어

그리고 우리는 추가 처리를 위해 이것을 필요로합니다 이것 이후에 우리가하는 일은 물론, 우리는이 기사를 번역합니다 우리는 75 개의 언어를 처리하기 때문에 우리 모두는 영어로 필요합니다 Google Cloud Translator를 사용합니다 API는 기사의 제목과 본문을 번역합니다

이제는이 기사가 무엇인지 알 것입니다 Ad van Gils는 PwC Netherlands의 새로운 CEO입니다 그리고 우리는 시체를 번역해야합니다 자, 우리는 영어로 된 기사를 가지고 있습니다 Google Cloud Natural Language 용으로 사용할 수 있습니다

API 처리 중 이 API는 우리에게 세 가지 일을합니다 우선, 우리는 기사의 정서를 분석하고 싶다 따라서 신용 리스크 관리자는 주로 부정적인 뉴스 따라서 부정적인 감정은 신용 위험에 더 중요합니다

긍정적 인 정서보다는 매니저 그래서 우리는 단지 정서를 분석합니다 그리고 여기에 그것은 말하고 있습니다 좋습니다 일반적으로 매우 음수 인 마이너스 1 사이이며, 매우 긍정적 인 1은 0

26이다 그것은 아주 긍정적이었습니다 그리고 여기에 우리는 규모가 있습니다 크기는 다음을 나타내는 숫자입니다 이 텍스트에서 사용 된 감정 표현의 수

그것은 33입니다 NLP에서 두 번째로하는 것은 엔티티를 분석하는 것입니다 그리고 이것은 우리에게 중요한 부분입니다 왜냐하면 우리는 엔티티를 추출하기를 원하기 때문입니다

그리고 우리는이 기사가 어떤 주체인지 알고 싶습니다 그러니 실행 해 봅시다 글쎄, 여기에 Ad van Gils가 사람으로 추출 된 것을 볼 수 있습니다 또한 조직으로 PwC 네덜란드를 추출했습니다 그리고 여기 왜 Wikipedia가 보입니까? 우리에게 그렇게 중요합니다

우리가 가진 것이기 때문에 우리는 방금 PwC를 찾았습니다 PwC를 검색 할 때 우리는 결과가 우리가보고있는 PwC에 관한 것인지 확인하십시오 그러나 NLP가이를 처리하고 말하면, 이봐, 이건이 회사의 위키 백과 다 그리고 우리 데이터베이스에 위키 백과가 있다는 것을 압니다 이제 우리는 경기를 할 수 있습니다

이것은 정말로 우리가 관심을 가지고있는 회사입니다 그리고 저는이 예를 보았습니다 조금만 가자 여기 그것이 말합니다, Waterpolo Association PwC, 이것은 완전히 다른 존재입니다 텍스트가 일치합니다

그러나 아마도 NLP를 통과한다면, 이 엔티티를 인식하지 못한다 프라이스 워터 하우스 쿠퍼스 (PricewaterhouseCoopers) 정말 중요합니다 당신도 보시다시피, 돌출부가 있습니다 그리고 그 돌출은 매우 중요한 숫자입니다 그리고 그것은 엔티티의 중요성을 나타냅니다

이 기사 내에서 그래서 그것은 중요성에 의해 주문되었습니다 그래서 Ad van Gils가 가장 중요한 존재라고합니다 그리고 그 옆에는 PwC입니다 그리고 여기에서는 우리가 구별 할 수 있습니다

이 기사는이 실체에 관한 내용입니다 아니면 기사에서 어딘가에서 찾았습니까? 우리는 또한 엔티티마다 감정이 있습니다 우리는 점수와 규모와 같은 것을 가지고 있습니다 따라서 기사가 부정적 일 경우, 우리는 알고 싶습니다 좋아요, 그 주체에 대해 정말로 부정적입니까? 아니면 다른 주체에 관한 것인가? 우리는 두 개의 엔티티가 더 있습니다

여기에 적절한 유형의 엔티티 만 있습니다 모든 엔티티가 발견되는 것은 아닙니다 그리고 당신이 여기에서 보는 것은 타입 이벤트이기도합니다 그리고 이것은 나중에 클러스터링에 중요합니다 그래서 그것은 두 가지 사건을 인정합니다

그래서 Ad van Gils가 새로운 CEO로 임명 된 것이 었습니다 그리고 여기에 이벤트로 약속이 있습니다 NLP가 우리를 위해하는 마지막 일은 분석입니다 기사의 범주 그래서 Google은 수백 개의 카테고리를 구성합니다

그들은이 NLP 기능을 가지고 있습니다 어떤 카테고리의 기사인지 예측할 수 있습니다 예를 들어, PwC 스포츠 이벤트를 후원하고 기사 프로가 될거야 스포츠로 분류된다 그리고 그것은 우리가 관심이없는 범주입니다

그래서 우리는 화이트리스트 카테고리만을 사용합니다 비즈니스 및 산업 또는 회사 뉴스 그리고 여기에 그것은 90 %가이 기사 비즈니스 및 산업 카테고리에 속합니다 이제는이 기사를 계속 처리 할 수 ​​있습니다 그러나이 수백 개의 카테고리 아직도 아주 일반적이고 근거가 없다 또는 신용 위험 분야에 대해 명시되지 않은 경우, 우리는 몇 가지 주제를 스스로 정의했습니다

우리는 분류 할 수있는 몇 가지 모델을 훈련 시켰습니다 이 주제에 대한 기사 그래서 우리는 이보다 더 교육을 받았지만 [INAUDIBLE] 배우십시오 그리고 이것들은 예를 들어, 기사가 사기 또는 약 사기인지를 예측 파산, 정말 주제가 신용 리스크 관리자에게 중요합니다 그래서 여기에 그것은 11 %가 사기에 관한 것이고, 파산에 대해 8 % 확신

이제 완전히 새로 생성 된 요약을 생성합니다 개요 따라서 대시 보드에 표시 할 수 있습니다 그리고 나서, 우리는 원래의 몸을 제거 할 수 있습니다 우리가 더 이상 필요하지 않기 때문에 번역 된 몸

우리는 필요한 모든 정보를 추출했습니다 그리고 이제 마지막 부분 인 클러스터링이 있습니다 그래서 우리가 클러스터링을 할 때 우리는 모든 열이있는 하나의 큰 행렬을 만듭니다 발견 한 엔티티와 발견 한 모든 기사 그래서 수십만 명이 있습니다

행렬의 열 수는 수백만 개입니다 나는 모른다 행은 개별 기사입니다 그리고 여기서 당신은 가치로서 그 주체의 돌출 성을 봅니다 특정 기사에서

따라서이 예에서는 관련 기사를 예를 들어, 이것을 매트릭스에 추가하여 우리가 클러스터링을 어떻게하는지 그래서 우리는이 약속에 관한 관련 항목을 발견했습니다 그리고 그것을 매트릭스에 추가합니다 그래서 여러분이 볼 수있는 것은 여기에 몇 개의 엔티티가 추가 된 것입니다 그래서이 실체는 두 번째 기사에서 발견됩니다

그러나 첫 번째 기사에서는 그렇지 않습니다 또한이 엔티티는 처음에는 발견되지 않습니다 첫 번째 기사에는 있지만 두 번째 기사에는 없습니다 그리고 우리는 여전히 그것을 볼 수 있습니다, Ad van Gils 첫 번째 기사에서 가장 중요한 존재입니다 그리고 두 번째 기사

이제 우리가 할 수있는 것은 우리가 계산하는 것입니다 코사인 유사성은 그냥 계산할 수있는 수학 공식 두 벡터 사이의 거리, 그래서 이 벡터 및이 벡터 그리고이 거리에서, 우리는 말할 수 있습니다 좋습니다이 두 기사 같은 사건에 관한 것입니다

그래서 그것을 계산해 봅시다 여기에 그것은 말한다, OK, 나는 82 % 다 – 우리는 이것들이 82 % 일치합니다 – 이 두 벡터에 대해서 그리고 우리는 한계점을 가지고 놀 수 있습니다 우리가 말하는 곳에서, OK, 80 %로 임계 값을 설정하면, 이 두 기사는 함께 묶일 것입니다 임계 값을 85 %로 설정하면 그들은 함께 모여 있지 않을 것입니다

이제 데모 용이었습니다 이것은 내 생각에 15 분을 소비한다 직장에서 15 초 정도 걸릴 것 같습니다 그리고 우리는 하루에 10 만 번합니다 그리고 우리에게 실제로 도움이 된 것은 사실이었습니다

우리가 확장 할 수있는 Kubernetes Engine과 Pub / Sub를 사용했습니다 이제 우리는 250 명의 거래 상대방을 보유하고 있습니다 어쩌면 10 배까지 증가 할 것입니다 그리고 우리가 확장 할 수 있다고 확신합니다 그 거래 상대방에게 고맙습니다

나는 오토에게 다시 생각해 [박수 갈채] OTTO VERMEULEN : 훌륭한 데모로 Peter, 감사합니다 그리고 이제 우리 모두 이해합니다 왜 당신의 취미는 Kubernetes입니다 우리는 GCP의 구성 요소가 많이 있다는 것을 알았습니다

그리고 우리 자신을 코딩하는 것도 꽤 많이했습니다 그래서 지금은이 세션을 끝내야 할 때라고 생각합니다 그리고 나는 당신에게 세 가지 주요 테이크 아웃을하고 싶습니다 첫 번째는 적시에 적절한 정보입니다 우리는 국제 은행 적절한 순간에 전 세계의 정보가 필요합니다

그 정보는 기하 급수적으로 증가하고 있습니다 그래서 중요한 질문은 올바른 정보를 얻는 방법이었습니다 적시에 신용 위험 관리자에게 알려야합니까? 그리고 나는이 개념 증명으로, 우리는 당신이 그것을 할 수 있음을 보여주었습니다 두 번째 주요 테이크 아웃은 클라우드 및 기계 학습입니다 우리가 본 것을 감안할 때, 지난 3-5 년 전에 이것을 만들 수 없었을 것입니다

하지만 지금은 클라우드의 출현과 함께 또한 모든 종류의 API 및 기계 알고리즘 배우기– 자연어 처리와 같은 번역과 같은 이와 같은 시스템을 개발하는 것은 아주 쉽습니다 그리고 마지막으로 민첩한 작업과 빠른 실험 – 우리는 올바른 툴링으로 적절한 팀이면 개념 증명을 구축 할 수 있습니다 단 12 주 만에 처음부터 그리고 당신도 그렇게 할 수 있고 내일 시작할 수 있습니다 시간 내 주셔서 감사합니다 [박수 갈채] [음악 재생]

Google Cloud Vision – How to use Google’s Image Recognition Technology on YouTube Thumbnails

안녕하세요, 유타 SEO 닌자에게 다시 오신 것을 환영합니다 내 이름은 트리스 톤과 이번이 처음이라면, 잊지 마시고 사물을 구독하셔야합니다

나는 너와 얘기하고 싶다 오늘은 Google Cloud 비전입니다 이제는 정말 깔끔한 작은 장난감입니다 이 지난 주 동안에 대해 알아 냈고 YouTube 마케팅 및 비디오 SEO 및 그와 같은 것들에 대한 회의 확인을 위해 미리보기 이미지를 스캔하는 방법에 대해 이야기했습니다 YouTube 또는 Google에서 귀하의 도달 범위를 제한하기 위해 잠재적으로 사용할 수있는 것 귀하의 온라인 콘텐츠 및 몇 가지 다른 흥미로운 생각 이것이 사용될 수있는 방법과 나는 많은 사람들이 검색 할 것이라고 생각한다

이 작업을 수행하는 방법에 대한 자습서를 얻으려는 시도가 있었으므로 앞으로 나아갈 것이라고 생각했습니다 함께 작은 비디오를 보여주고 무엇을해야하고 어떻게해야하는지 보여줍니다 정말 빨리 첫번째 물건을 먼저 가지고 가려고합니다 cloudgoogle

com/vision이 페이지 오른쪽으로 이동하게됩니다 여기를 따라 가면 api와 api로 작업을 시작할 수 있습니다 콘솔과이 모든 것들이 우리 대부분이 생각하는 것 이상입니다 실제로 나는 이것을 얻을 수 없었던 것처럼 관리 할 수있게 될 것입니다 아직 일하면서 내가 버킷에 문제가 있다고 말하면서 그걸로, 내가 너희들에게 알릴 것이다

그러나 만일 당신이 여기 조금 아래로 내려 가면 실제로 API를 테스트 할 수 있으므로 시스템을 테스트 할 필요가 없습니다 다른 미친 백엔드 물건에 들어가서 내가 여기에 몇 가지 그림이있어 테스트하고 여러분에게 보여주고 싶고 다른 것들을 그려 볼 수 있습니다 그러고 나서 우리가 그 일을 마치면 나는 너에게 줄 것을 원해 이 아이디어를 통해 우리의 아이디어와 생각을 YouTube 용 웹 사이트 등 모두에 접근하십시오

그래서 시작하고 시작하겠습니다 우리는 셀카를보고 시작할 것입니다 그래서 우리가 먼저 알아 차릴 것입니다 이것은 실제로 얼굴을 인식 할 수 있고 무엇이 같은지 추측하려고 시도한다는 것입니다 감정이 드러나고 있습니다

그리고 여러분이 볼 수 있듯이 저는이 표현에 대해 충분히 표현하지 않았습니다 레이블을 클릭하면 특정 이미지가 표시되어 개인을 표시합니다 그림의 요소들, 예를 들어 얼굴 머리를 볼 수 있습니다 예 여기 저기에 약간의 모서리가있어 실제로 감지 할 수 있습니다

당신은 그것이 클로즈업이라고 말할 수 있습니다 초상화입니다 조금 목이 찢어졌습니다 나는 눈썹있어 내가 가진 사람의 얼굴이야

큰 이마 그래서 우리는 그 모든 정보를 바로 볼 수 있습니다 우리는 웹에 갈 수 있습니다 이것이 무엇을 할지는 일반적으로 공통적 인 기본 키워드를 보여줄 것입니다 이 특정 이미지 또는 유사한 이미지에 사용되므로 예를 들어 눈썹 사진을 찾을 수 있습니다 아래로 스크롤하면 페이지를 찾을 수 있습니다

이미지가 일치하여 해당 이미지가있는 사이트가 여기에 있습니다 부분적으로 매치 된 이미지는 다음과 같은 그림이 될 것입니다 이것과 비슷한데 나는 내 자매 중 한 명처럼 보이지 않는다 그 형제를 제외한 모든 형제 자매들이 빨간 머리이므로 나는 내 네가 재산에 가면 이름이 내가 아는 어떤 것을 탐지하고있다 당신이 지배적 인 색깔을 좋아하는 것을 보여줍니다

JSON을 착각하지 않으면 이것이 실제로 기차를 좋아하는 용도로 사용됩니다 인공 지능은 나중에 우리가 다른 백에 들어가는 것이 아닙니다 그것에 확실한 백분율 그러나 나는 그것이 그것이 인 것을 위해 꽤 확신한다 안전 검색 정보는 실제로 꽤 재미 있습니다 Google에서 가끔씩 검색을하는 것처럼 익숙합니다

저장된 검색 설정을 해제할지 묻는 콘텐츠를 차단합니다 잠재적으로 성인용 콘텐츠를 알기 위해 해당 설정을 조정하십시오 그래서이 도구가 무엇을 할 것인가? 그들은 또한 그것을보고 시도하고 추측 할 수 있습니다 여기에 잠재적으로 안전한 수색에 해당 할만한 것이 있습니다 예를 들어 필터가 너무 희박하기는하지만 저는 두 가지 포인트가 있습니다

경주는 하나가 아니라 1 ~ 5 점으로 매우 높지는 않습니다 어른이되면 스푸핑 일 수있는 약간의 기회가 있으며 당신이 내가 약간 경미한 YouTuber 인 것을 알기 때문에 그것은 너무나도 멋질 수 있습니다 나는 당신이 팝업이 무엇인지보기를 원한다면 그것을 염두에 두라 이 비디오를하기 위해 무엇을 검색해야 할지를 알아 내야합니다 내 아내와 문제가 생겼어

나는이 이미지와 함께 여기까지 갔다 우리는이 이미지가 화가 났는지 아닌지 알게 될 것입니다 다시 우리는 우리의 다른 레이블을 볼 수 있습니다 그래, 속옷 핑크색 수영복 복부 근육 트렁크 등등의 몇 가지 다른 예가 있습니다 인터넷을 통해 그래서 당신은 부분적으로 일치하는 이미지를 얻고 싶습니다 똑같은 것을 물어보십시오

방금 다시 속성이있는 밈으로 바뀌 었습니다 우리의 원색 비율에 대해 이야기 한 다음 안전한 검색으로 가면 소프트웨어는 여기에 성인용 콘텐츠가 있지만별로 많지 않다는 것을 알 수 있습니다 분명히 모든 것이 덮여 있기 때문에 완전히 필터링해야합니다 그러나 racy가 racy 일 가능성이 높기 때문에 이걸 사용한다면 youtube 미리보기 이미지가 있으면 동영상이 아주 좋은 기회입니다 제한 모드로 설정되어 있으면 도달 범위가 넓어지지 않습니다

내가 생각한 또 다른 예가 정말로 흥미 롭다 네가 그 녀석을 본 후에 나는 여기 강아지의 그림을 끌어와 비키니 입니 다 그러면 우리는이 그림을 빠르게보고 스캔 할 것입니다 그것이 말하는 것은 그것이 매우 진실한 doglike 포유류 다라고 말한다

개는 시베리안 허스키라고도 할 수 있습니다 허스키 썰매 개 허스키 알래스카 개 알래스카 부츠 Canadian Eskimo Dogs 그리고 나서 우리는 할 수있다 또한 그것이 강아지 인 것을 본 다음, 그것이 말한 또 다른 부분이 있습니다 여기 미니어처 시베리아 허스키 스에 간다 75 % 그게 바로이 그림이 무엇인지 그리고 그것이 올바른지 확률 미니어처 시베리안 허스키 우리는 온라인으로 볼 수 있고 이것의 다른 예를 찾을 수있다 그것이 Pinterest에있는 이미지를 참조하십시오 그리고 다른 장소의 전체 잔뜩 여기에 있습니다 검색에 사용되는 키워드는 모두 유용합니다

깨끗하고 썸네일로 사용할 수있는 아주 좋은 그림이 될 수 있습니다 당신의 비디오가 시베리안 허스키 즈에 관한 것이라면, 내가 어떻게 당신이 그것을 보게하고 싶었 을까? 일부는 일했고 밖으로 나가고 놀 수 있었지만 몇 가지가 있습니다 우리가이 큰 것 중 하나에 사용할 수 있다고 생각하는 흥미로운 것들 Google을 볼 때 Google을 살펴볼 때 현장을 바라 보았습니다 YouTube 동영상에서 볼 수있는 관련성 특정 주제 또는 특정 키워드와 관련된 것이 있다면 우리 웹 사이트가 있다면 조금 더 높은 순위에 올거야 최적화 및 해당 웹 사이트는 검색 용어의 순위를 알기에 적절합니다

백 링크가있는 관련 웹 사이트에서 오는 백 링크가있는 경우 더 높습니다 나는 우리가 할 수 있다고 생각하는 당신의 순위에 대해 더 강해지고 더 많은 가치를 가질 것입니다 잠재적으로 이것과 관련이 있습니다 내가 생각하기에이 아이디어는 우리가 웹 사이트 순위를 조금 높이고 싶다면 온라인으로 홍보하고 싶었습니다 조금 더 나은 또는 우리의 YouTube 임대 조금 나는 이미 우리가 선택한 것에 조금 더주의를 기울 였다고 생각한다

우리가 와서 그 이미지를 먼저 스캔해서 그것들은 웹 사이트의 내용과 관련이 있다고 생각합니다 Google이 가고 있다고 생각합니다 저것을 볼 수 있고 나는 그것이 우리가 조금 움직이는 것을 도울 것이라고 생각합니다 조금 더 많이 검색 할 수 있기 때문에 검색에서 조금 더 높습니다 우리가 목표로 삼고있는 검색어와의 관련성 정말로 중요하고 또 다시 우리는 웹에서 여기를 볼 때 우리가 볼 수있는 앵커 텍스트 alt 텍스트를 볼 수있는 부상 키워드 이 이미지와 관련이 있으므로 잠재적으로이 이미지를 이러한 검색어에 대한 참조를 다시 한 번 볼 수 있습니다

재미있는 것은 그들이 일어난 일 중 하나였습니다 컨퍼런스는 소프트웨어가 조금 더 빨라지 자마자 YouTube 동영상에 조금 더 효과적으로 사용할 수 있습니다 뿐만 아니라 동영상의 각 프레임을 스캔하고 당신은 어른 콘텐츠 또는 어쩌면 반드시 그렇지 않은 무언가를 알고 있습니다 동영상의 콘텐츠와 관련이있는 키워드는 귀하가 순위를 매기려고 시도하면 잠재적으로 순위를 높이거나 상하게 할 수 있습니다 거기 또는 당신의 범위 그래서 나는 그것이 정말로 흥미 롭다는 것을 다시 생각했다

당신이 정말로 빨리 들어가서 어떻게 찾을 수 있는지 보여주기 위해서 실제로 사이트의이 부분과 그 밖의 모든 것을 찾기 위해 약간 그걸 가지고 놀아 라 네가 정보를 찾았 으면 좋겠다 만약 당신이 의견을 나에게 알려주지 않았다면 아직 구독 중이므로 다음과 같은 동영상을 더보고 싶습니다 정말로 쉽고 정말 쉽고 적어도 지금은 무료입니다 그래서 그게 나를 위해있을거야 내 이름은 유타에서 Triston이다 SEO Ninja, 좋은 하루 되세요

그리고 다음 비디오에서 너희들을 볼거야 안녕

Leverage AI on the Cloud to Transform Your Business (Next Rewind ’18)

CASSIE KOZYRKOV : 다음 2018 년에 300 회 이상의 세션이 있으며, 너는 그들 모두에게 다가 갈 수 없다는 것은 이해할 만하다 그래서 당신이 클라우드를 활용하지 않았다면 귀하의 비즈니스를 변화시키고, 계속 지켜봐주십시오

왜냐하면 여기에 되감기가 있기 때문입니다 [음악 재생] 기계 학습은 알고리즘 접근법입니다 데이터로 반복적 인 결정을 내리는 것 시작하기 전에 모든 구성 요소가 있는지 확인하십시오 배울 데이터, 확인; 기계 학습에 대한 액세스 알고리즘, 확인; 반복적 인 결정을 자동화하려는 욕구 – 우리는 정말로 여기 반복을 말하고 있습니다

10 가지의 결정이 아니라 10,000이나 100 억에 가깝습니다 검사 큰 이야기에서 나온 큰 아이디어를 요약 해 봅시다 첫째, ML을 사용하여 여러 문제를 해결할 수 있습니다

오늘 규칙을 작성 사실, 그것을 적용 할 수있는 기회를 찾을 수있는 좋은 방법입니다 귀하의 비즈니스에서 규칙을 찾는 것입니다 예 : Google 검색에서 검색어 완성 는 손으로 만든 규칙의 진짜 얽힘이었습니다 그것에 기계 학습을 적용하는 것은 우리의 가장 큰 부스트를 가져 왔습니다

2 년 넘게 품질 순위를 매겼습니다 둘째, 기계 학습은 응용 프로그램을 개인화하십시오 ML은 손수 만든 규칙보다 잘 확장되기 때문에 기존 논리 위에 모델을 레이어 할 수 있으며, 당신은 이제 또한 주요 사용자와 다른 사람들을 기쁘게 할 수 있습니다 분견대 자, 물론,이 모든 것을 확인하는 것은 데이터입니다

ML을 규칙 기반 프로세스로 전환하는 것으로 생각할 수 있습니다 그것의 머리에 모델 또는 규칙으로 시작하는 대신, 그것을 뒤집어서 데이터로 시작하십시오 셋째, 기대를 지닌 설계 시스템 내년에는 더 많은 데이터를 얻을 수 있습니다 너의 세계는 정적이 아니기 때문에 너는 기대해야한다

데이터가 커지게됩니다 그리고 더 많은 데이터가 이기기 때문에 이것은 좋은 일입니다 그러나 이것이 당신을 두는 때 무엇이 ​​일어나는가? 엑사 바이트 또는 페타 바이트 영역에서? 예를 들어, 깊은 학습은 잘 작동합니다 큰 데이터 세트 선형 적으로 오류율을 떨어 뜨리려면, 데이터를 기하 급수적으로 늘려야합니다

저기서의 로그 스케일입니다 나는 예측을 좋아한다 당신이 깊은 학습에 있다면, 나는 예측한다 당신의 미래에 많은 데이터 여기에 제안이 있습니다

모든 개인적인 시간을 소비하지 마십시오 큰 데이터 인프라에서 대신 서버리스 방식을 사용하십시오 그래서 당신은 실제로 당신을 데려 오는 것에 당신의 노력을 기울일 수 있습니다 가장 가치있는 것 인프라가 아닌 코드 측면에서 생각해보십시오

우리를 네 번째 아이디어로 이끌어줍니다 인프라를 잊어 버릴 수있는 플랫폼 사용 훌륭한 사전 제작 된 모델을 제공합니다 다양한 ML 시나리오에 대한 유연성을 찾으십시오 그럼 깊은 학습을 다시 살펴 봅시다 최첨단 머신을 수행하는 데 필요한 컴퓨팅 성능 지난 6 년간 학습은 천만 번 증가했습니다

천만 번이나 당신이 최첨단에 있고 싶다면, 효율적이고 비용 효율적인 ML이 필요합니다 환경 점점 더 많은 데이터를 처리하기 위해 분산 될 필요가 있습니다 점점 더 많은 계산을 처리하기 위해 더 나은 하드웨어가 필요할 것입니다

Google Cloud는 이상적인 환경을 제공합니다 하드웨어의 분산 처리 용 당신의 필요에 맞게 환상적인 서버 관리 방식을 제공합니다 훌륭한 사전 빌드 된 모델로 ML을 실행하려면, 그래서 처음부터 모든 것을 만들 필요가 없습니다 네가 원치 않으면

제 말은, 왜 재발견 할 필요가없는 바퀴를 재발견하는 겁니까, 그렇죠? 이 이야기를 요약하면, 다채로운 사용 사례를 생략했습니다 그 아이디어를 실제로 현실로 가져옵니다 영화 추천 시스템, 사기로부터 기계 학습 학습 탐지, 고객 서비스, 사물의 인터넷, 자동차 경매, 게임 등 가득 찬 이야기를보고 싶다면, 설명의 링크를 확인하십시오 아래를 클릭하고 Cloud YouTube에 가입하는 것을 잊지 마십시오

채널을 통해 다음 되감기 콘텐츠를 더 많이 얻을 수 있습니다 지켜봐 줘서 고마워 [음악 재생]

Machine Learning on Google Cloud Platform (Cloud Next ’18)

[음악 재생] 안녕, 여러분 모두들 안녕

관객 : 안녕하세요 크리스 클리브런 : 좋아요 제 이름은 크리스 클레 ​​반입니다 Justin Lawyer와 함께 우리는 제품 관리자입니다 Google 클라우드에서 우리는 당신과 대화 할 것입니다

GCP에서 기계 학습에 관한 정보 그래서 저는 매우 투명한 사람입니다 나는 그것을 무엇보다 명확하게 할 것입니다 나는 당신의 테이크 아웃이이 이야기에서 나온 것이기를 바랍니다 하나, 당신이 정말로 흥분하기를 바랍니다

기계 학습으로 할 수 있습니다 둘, 자신감을 갖기를 바래 조직에서 기계를 성공적으로 구현할 수 있는지 확인하십시오 Google Cloud로 학습하십시오 셋째, Google AI의 관심사를 통해이를 신뢰하십시오

우리는 당신의 ML을위한 올바른 플랫폼이자 파트너입니다 워크로드 세 번의 테이크 아웃 이요 우리는 당신이 그 테이크 아웃을 얻으려고 이야기 할 것입니다 우리가 그것을 파고 들기 전에, 나는 단지 당신에게 감사의 말을 전하고 싶다

우리 모두는 바쁜 삶을 사는 데 제한된 시간을 가지고 있습니다 Google Cloud, 다음 컨퍼런스, 이 세션 고마워 ML이 당신을 위해 무엇을 할 수 있습니까? 그것은 놀라운 것들을 많이 할 수 있습니다 조직에 경쟁이있는 경우, 그들이 ML을보고 있다고 보장합니다

자, ML은 반드시 정신병자를 발명하는 것이 아닙니다 교통 수단을 이용하는 경우 순간 이동을 어떻게 만들지가 아닙니다 기존 비즈니스 및 프로세스를 이용하는 것입니다 다시 상상하고 재발견 할 수있는 능력 너 오늘하고있는 일 ML에는 세 가지 종류의 큰 영역이 있습니다

통찰력을 얻는 데 도움이 될 수있는 도움이 될 수 있습니다 또는 고객이 제품 혁신에 도움을 줄 수 있습니다 자동화에 도움이됩니다 진짜 자동화를 빨리 봅시다 자가 운전 트럭과 자동차 – 모두가하는 사업 교통과 택시로 오늘하고있다

그것을 더 빠르고, 저렴하게, 더 쉽고, 더 안전하게 만들어줍니다 혁신을 살펴 보겠습니다 우리 고객 중 한 명이, 디즈니, 우리의 제품 AutoML을 사용하여 혁신 그들의 소매 서비스 사용자 경험을 원했습니다 그들이 찾고있는 제품을 정말 빨리 찾을 수 있습니다

그래서 그들은 웹 인터페이스를 사용하여 커스텀 모델을 만들었습니다 전문 지식이 필요하지 않습니다 그리고 지금 그들의 수색 경험에서, 당신은 "해변에 미키 마우스"를 입력 할 수 있습니다 해변과 관련된 모든 제품을 찾습니다 그리고 미키 마우스 – 정말로 멋지다, 정말로 쉽다

그리고 통찰력 – 당신이 비행기라고 가정 해 봅시다 제조사, 항공기, 그리고 당신은 정말로 안전에 관심이 있습니다 IoT 덕분에 엄청난 양의 데이터가 있습니다 이 악기들이하고있는 것 그리고 그 데이터를 수집한다면 어떻게 처리할까요? 그리고 아마 당신이 그걸 예측할 수 있다면 어떨까요? 비행기 정비 전에 필요한 정비 부품 정기적으로? 안전에 대한 통찰력, 그래서 무엇에 대해 흥분을 느끼는지 귀하의 조직이 할 수 있습니다

그래서 손을 보여줍니다 누가 여기에, 그들의 조직, 찾고 있습니다 오늘 기계 학습으로? 큰 손을 한 번 더 보여줍니다 여기 누가 기계 학습이 무엇인지 이해한다고 생각합니까? 네가 반 정도는 마지막 질문 – 누가 기계 학습 모델인지 알 수 있습니까? 네, 대부분

그래서 이것에 대해서 간단히 만질 것입니다 기계 학습은 데이터에 관한 것이며 데이터를 가져 오는 것입니다 통찰력과 행동 거기에는 모든 종류의 데이터가 있습니다 이미지, 구조화되지 않은 텍스트, 관계형 데이터베이스, 시퀀스 정보

그리고 기계 학습은 그 데이터를 취하는 것입니다 다양한 종류의 ML 알고리즘을 취하고, 그 알고리즘을 통해 그 데이터를 통과 거대한 인프라 세트가 필요합니다 그리고 그 데이터를 통과하면, 기계 학습 모델이 생성됩니다 그리고이 모델은 점점 좋아집니다 더 많은 데이터, 더 나은 알고리즘, 더 많은 인프라

그리고이 모델을 사용하여 통찰력, 자동화, 혁신 그래서 우리 모두는이 서비스, 웹 검색을 알고 있습니다 Google은 AI 회사이자 데이터 회사입니다 18 년 동안 세계 데이터 수집, 모든 사람이 접근 가능하고 사용 가능하게 만듭니다 우리는이 분야에서 많은 전문 지식을 보유하고 있습니다

대규모 데이터 센터, 인공 지능 전문가, 데이터 전문가 Google Cloud가 제공하는 전문 기술은 ML에 너에게 이것은 우리가 내부적으로 가지고있는 것에 대한 멋진 작은 이야기입니다 ML을 성공적으로 구현했습니다 Brein이라는 내부 AI 팀은 ML 모델을 만듭니다

알고리즘을 통해 수많은 데이터를 가져와 대규모 인프라 스트럭처를 통과시켜야합니다 ML 모델을 만들 수 있습니다 하지만 Google의 모든 소프트웨어 개발자는 아닙니다 ML 전문가입니다 우리가 한 일은 우리의 소프트웨어를 둘러 보았습니다

개발자를 교육하고 기존 모델로 ML을 구현하는 방법 그래서이 그래프가 보여주는 것은 소스 코드의 개수입니다 개발자가 Brain의 ML 모델을 사용하는 저장소 AI를 내부 서비스에 성공적으로 구현하기 위해, 외부 제품 Google은 이러한 유형의 개념을 Google Cloud에 도입합니다 오른쪽에는 여러 제품이 있습니다

ML과 AI를 통합했습니다 나는 그들 모두에 대해 이야기하지 않을 것이다 나는 두 가지에 대해서 이야기 할 것이다 내 즐겨 찾기 그래서 저는 아빠입니다, 저는 세 명의 아이들이 있습니다

그리고 저는 아이들의 디지털 사진을 많이 찍었습니다 어리석은 금액, 아마도 총 10 만개 그리고 저는이 Mac을 가지고 있었고 하드 드라이브가 몇 개 있었는데, 저장 용량이 걱정되어 Google 포토가 생겼습니다 무료 무제한 저장 글쎄, 잘됐다

값이 싸고 확장 가능하며 물건을 뒷받침하는 것에 대해 걱정해야합니다 그러나 실제로, 혁신은 검색 기능이었습니다 얼굴 인식 기능이 있으며 우리 애들이 누군지 알고 있습니다 내 얼굴 사진을 클릭 할 수 있습니다 내 전화에서 해변이나 보트 같은 단어를 입력하고, 이제 10 만 장의 사진을 찍습니다

내가 찾고있는 정확한 사진을 찾습니다 과거에는 20 분이 걸렸을 것입니다 ML은 혁신적이며 그렇게 할 수도 있습니다 조직의 규모에 관계없이 기술 직원 유형에는 ML을 구현하는 여러 가지 방법이 있습니다 그리고 우리는 두 가지 방법에 대해 이야기 할 것입니다

첫 번째 방법은 ML 모델을 사용하는 것입니다 ML 전문가가 될 필요는 없습니다 소프트웨어 개발자 일 필요가 있습니다 또는 귀하의 조직이 REST API를 사용하는 프로그래밍 언어 사용하기 쉽다

CXO 나 결정을 내리는 경영자라면, 프로젝트에 자금을 지원합니까? 높은 품질의 모델을 만드는 것은 매우 위험합니다 소프트웨어 개발자에게 API를 사용하게한다 그것을 구현하고, 정말로 빨리 시작하십시오 그리고 다른 길은 커스텀 모델을 만드는 것입니다 어쩌면 당신은 당신의 공간에서 도메인 전문가입니다

또는 데이터에 액세스 할 수 있고 원하는 자신 만의 ML 모델을 만들 수 있습니다 그래서 우리는 전문가들을위한 많은 도구들을 가지고 있습니다 빠르고 저렴한 ML 처리를 위해 그리고 여기가 저스틴에게 넘겨 줄 것입니다 그리고 그는 이것들에 대해 조금 이야기 할 것입니다

자세한 세부 사항 크리스틴 고마워 고마워, 크리스 그래서와 주셔서 대단히 감사합니다 오늘, 우리는 이야기 할 것입니다

당신의 직업에 맞는 도구를 어떻게 찾을 수 있습니까? 당신의 분야에서 전문가로서? 그래서 우선, 크리스가 언급 한 것처럼, Google은 많은 기계 학습 모델을 만들었습니다 특정 애플리케이션이 Google 애플리케이션을 강화할 수 있습니다 그래서 우리는 당신 주위에 REST API를 포장했습니다 소비하기 위해 우리는 이것을 지각 API라고 부릅니다

그들은 일반적으로 인간의 인식 주위에 있기 때문에 사용자가 애플리케이션과 상호 작용하는 방식 이렇게 빨리 다음 슬라이드로 이동하면, 이 API에는 크게 세 가지 범주가 있습니다 하나는 사이트에 관한 것이고 다른 하나는 대화에 관한 것입니다 세 번째 것은 언어에 관한 것입니다 아마 이들 각각을 걸을 것이 중요하다고 생각합니다 정말 신속하게 당신이 일종의 즉석에서 이해할 수 있습니다

코딩 없이도 얻을 수있는 기능 REST API를 사용하는 것 외에는 귀하의 응용 프로그램에 그래서 우선, 시력을 위해, 당신이 이미지를 가지고 있다고 말하면서, 그 이미지의 내용을 이해하고 싶습니다 자동으로 이미지를 Vision API에 전달하면 그 이미지 안에있는 물체가 무엇인지를 이해할 수 있습니다 자동으로, 그리고 당신은 얼굴이 어디 있는지 알아낼 수 있습니다, 다른 사람들에게 알릴 수 있습니다 동영상 이해 API의 경우 동영상, 장면 전환, 다른 대상을 알려줄 수 있습니다

해당 비디오 내에서 기본적으로 검색하고 찾을 수 있습니다 동영상 내 또는 동영상 전체에서 원하는 내용 여러 동영상을 전달하는 경우 OCR – 종종 사람들은 스캔 한 문서를 가지고 있습니다 그리고 무엇을 이해해야합니까? 도크는 그 문서에 있습니다 어쩌면 그것은 PDF 파일 일 수도 있고 GIF 파일 일 수도 있습니다

너는 할 수 있어야한다 GIF, JPEG가 아닙니다 API에 전달할 수 있습니다 그런 다음 자동으로 감지합니다 그 문서의 단어들은 무엇입니까? 그 원시 텍스트를 나중에 줄 수 있습니다

또는 장면의 이미지를 가지고 있거나, 벽에 징후가있다 그것은 당신에게 그 사인에 관한 텍스트를 줄 것입니다 따라서 OCR은 일상적인 응용 프로그램에서 정말 편리합니다 성인용 콘텐츠는 사실 실제로 하나입니다 정말로 중요합니다

사용자가 제출 한 콘텐츠를 얻으십시오 당신은 그 이미지에 무엇이 있는지 모릅니다 당신은 당신이 아닌지 확인해야합니다 사용자에게 부적절한 이미지를 제공합니다 따라서 성인용 콘텐츠 검색은 정말 쉬운 방법입니다

그 이미지에서 무슨 일이 일어나고 있는지 감지 할 수있게 당신이 걸러 내야 만하는 것이죠 귀하의 사용자에게? Conversation 클래스의 API의 경우 – 오디오를 텍스트로 – 스트리밍 오디오가있을 수 있습니다 그 다음 파일은 당신이 무엇을 말하고 있는지 알아 내야합니다 그런 다음 그 사건을 베끼고 그것을 당신에게줍니다 그것은 비디오, 사람들과의 실제 대화, 텔레비젼 쇼를 위해 무엇이든간에

그 반대도 가능합니다 텍스트 문자열이있을 수 있습니다 당신의 사용자에게 읽어 줄 필요가있다 자, 문자열을 응용 프로그램에 전달합니다 그러면 합성 음성을 만듭니다

그런 다음 사용자에게 알릴 수 있습니다 채팅 봇은 사용자와 소통 할 수있는 방법입니다 채팅에서 직접 원하는 상호 작용을 프로그래밍 할 수 있습니다 사용자와 대화하고 특정 종류의 대화를 프로그래밍 할 수 있습니다 계속해서 고객 서비스 전화로 도움을 받으십시오

또는 그런 것들 언어 API에서, 자유 형식의 텍스트를 가지고 있다면 정말 어렵습니다 정말 도대체 무슨 소리 야? 우리는 밖으로지도하고 무엇의 맥락을 알아낼 것입니다 말하자면, 문장의 데이터 구조를 찾아 내고, 당신이 알아낼 수 있도록 말의 부분을주세요 좋아, 명사 란 무엇인가? 동사는 무엇인가? 이것들의 관계는 무엇입니까? 그리고 나서, 당신은 지능적인 것을 할 수 있습니다

그 구조와 감정 분석은 함께 전송되는 분위기는 무엇인가요? 그 단어들로? 우리가 가진 것은 우리는 많은 좋은 성공을 시도했습니다

예를 들어 고객 서비스의 정서를 모니터하는 것 이메일이나 채팅, 물건 나가기 관리자에게 에스컬레이션 할 수 있음 그래서 물건들이 나선형으로 나오지 않도록 할 수 있습니다 제어 또는 무엇인가가 공격적인지 이해할 필요가 있다면, 또는 평온한, 또는 행복한, 당신은 어떻게 분류하고 있는지 확인합니까 고객이 평점을 매기는 것이 적절하다면 서비스 콜, 그런 것들? 번역에서는 자동으로 번역하는 좋은 방법입니다 한 언어에서 다른 언어로 예를 들어 다음에 대해 조금 이야기하겠습니다

예를 들어, 당신이 게임 개발자라고 말하면, 당신은 온라인 커뮤니티를 가지고 있습니다 하지만 그들은 전세계에서 온다 다른 언어로 말하기 당신은 그들이 서로 이야기 할 수 있기를 원합니다 실시간 채팅에서 기본적으로 할 수 있습니다

다른 언어로 번역 할 수있는 능력이 있어야합니다 따라서 Translate API를 사용하면 정말 쉽습니다 또는 인바운드 고객 서비스를받을 수 있습니다 이메일을 보내고 언어로 번역 할 수 있습니다 고객 서비스 담당자가 고객이 이해할 수 있도록 그러면 고객에게 응답 할 수있는 적절한 문서를 찾을 수 있습니다

이 API에 대한 좋은 점은 기본적으로 REST API 만 있으면됩니다 기본적으로 코드 스 니펫을 제공합니다 당신은 그것을 당신의 앱으로 팝니다 당신이 정말로 바꾸어야 할 유일한 것 데이터를 가리키는 키와 URI입니다 그리고 짜잔, 떨어져

그것보다 더 간단해질 수는 없습니다 다음 질문은 성능이 어떻습니까? 실제로 얼마나 효과가 있습니까? 그들은 일반적인 사용 사례에 정말 좋습니다 경우에 따라 문제가있을 수 있습니다 Google이 결코 다루지 않았던 또는 상황을 처리해야 할 수도 있습니다 Google이 다루어야 할 것보다 훨씬 더 자세하게 설명합니다

예를 들어 Google은 볼트와 못의 차이를 쉽게 알 수 있습니다 하지만 당신이 제조업 자라고 가정 해 봅시다 생산 라인에 2,000 개의 볼트가 있습니다 귀하의 부품에 대한 차이점을 어떻게 알 수 있습니까? 글쎄, 우리가 가능하게 한 것은 Cloud AutoML 그래서 당신은 라벨이 붙은 모든 부품의 이미지를 제공 할 수 있습니다 그리고 우리는 그들을 구별하지 못할 수도 있습니다

라벨을주지 않으면 그런 다음 모델을 교육합니다 그런 다음 REST API 엔드 포인트를 얻을 수 있습니다 귀하의 응용 프로그램에서 사용하십시오 그래서 좋은 점은 사용하기가 정말 쉽다는 것입니다

그리고 당신은 기계 학습을 알 필요가 없습니다 우리는 당신을 위해 그것을한다 그런 다음 응용 프로그램에서 사용할 수 있습니다 그래서 다음 질문은, 음, 이것이 얼마나 효과가 있습니까? 실제로 모든 오픈 소스보다 효과적입니다 밖에있는 모델

따라서 훌륭한 실적을 올릴 수 있습니다 그리고 사용하기가 정말 쉽습니다 그래서 정말 도움이되었습니다 그래서 실제로 ML을 사용하는 방법 중 하나입니다 또 다른 방법은 데이터 과학자가 있다고 가정 해 봅시다

내 자신의 데이터를 가지고 있기 때문에 내 모델을 만들고 싶습니다 그리고 그것은 내가 다룰 필요가있는 커스텀 문제입니다 음,이 작업에는 두 가지 다른 방법이 있습니다 하나는 클라우드 관리 서비스를 사용하고 있습니다 그리고 이것들은 당신이하지 않는 서비스입니다

인프라를 다루고 싶다 우리는 당신을 위해 그것을 다룰 것입니다 그렇게하면 컴퓨터 학습 프로세스에 집중할 수 있습니다 그래서 우리는 Dataproc과 Dataflow를 가지고 있습니다 그래서 당신은 당신의 전처리를 다룰 수 있습니다

Dataproc은 본질적으로 Hadoop 및 Spark이지만 관리, 또는 Dataflow가 백엔드에서 Beam을 사용하고 있습니다 프로세싱을 처리하는 관점에서 머신은, ML 엔진 또는 기계 학습 엔진, 인프라 스트럭처를 자동으로 가동시킬 수 있습니다 그리고 우리는 그걸 좀 알아볼 것입니다 당신이 끝나면 그것을 찢어 버려라 따라서 인프라 스트럭처가 사라집니다

데이터 과학자들로부터 모든 최상위 프레임 워크를 지원합니다 그리고 우리는 Datalab을 가지고 있습니다 데이터 탐색을 쉽게 할 수 있습니다 먼저 Datalab에 대해서, 얼마나 많은 사람들이 실제로 Jupyter Notebook을 사용했습니다 주피터 노트북에 대해 알고 있습니까? 약 3 분의 1 정도가 될 것입니다

나머지 사람들은 그렇게 이해합니다 주피터 노트는 근본적으로 데이터를 가리킬 수있는 앱 귀하의 데이터를 분석 할 수있는 코드를 제공하십시오

데이터를 시각화하고, 반환하고, 즉시보고, 얻을 수 있습니다 몇 가지 피드백을받은 다음 반복하여 반복하고, 그것을 계속 추가하십시오 전체 노트북을 재생할 수 있으며, 당신은 그저 특정 스 니펫을 연주 할 수 있습니다 직장 동료와 공유 할 수 있습니다 그래서 그것은 정말로 탐험하고 시각화하는 훌륭한 방법입니다

및 프로토 타입 그래서 환상적인 도구입니다 Datalab에 대한 좋은 점은 모든 다른 클라우드 서비스에 연결하도록 미리 구성 BigQuery와 ML 엔진 등이 있습니다 따라서 클라우드에서 벗어나기 만하면됩니다 랩톱에서 로컬로 사용할 수도 있습니다

기계 학습 엔진은 정말 좋은 방법입니다 임의의 데이터 사이트에서 분산 학습 수행 모든 상위 프레임 워크를 사용하여 데이터를 처리 할 수 ​​있습니다 그리고 다시, 그것은 관리 서비스입니다 따라서 모델과 데이터를 가리키고, 그리고 당신은 단지 그것을 회전시킵니다 그것은 당신을위한 모든 분산 훈련을 담당합니다

당신은 그것에 대해 걱정할 필요가 없으며 종료됩니다 모든 것을 찢어서 사용하는 것에 대해서만 비용을 지불합니다 그래서 이것을하는 것이 정말 효율적인 방법입니다 실수로 해당 VM을 켜두는 것에 대해 걱정할 필요가 없습니다 한달 전에 고지를 청구하고 청구서를받을 때

이것에 대한 또 다른 좋은 점은 배치 예측 및 온라인 예측도 수행합니다 기본적으로 이러한 일괄 예측 작업을 실행할 수 있습니다 정말 효율적입니다 또는 온라인 예측을 위해 REST API 끝점을 만듭니다 당신의 모델을 위해 당신을 위해 그리고 어떤 양으로도 봉사하십시오

당신은 당신이 가지고있는 많은 수의 앱을 필요로합니다 정말 쉬운 방법으로 앱을 관리 할 수있는 좋은 방법입니다 다른 하나는 데이터 과학자들이 종종 모델 최적화를하지 않는다 그것은 일종의 고통이기 때문에 모든 다른 매개 변수를 변경해야합니다

데이터 세트에 적합한 구성을 찾으십시오 글쎄, 우리는 그것을 ML 엔진에 내장했다 그래서 그것은 실제로 그것을 당신을 위해 간단하게 만듭니다 매개 변수 만 입력하면됩니다 최적의 모델을 찾으십시오

그래서 좋은 모델을 찾기보다는, 실제로 데이터 세트에 가장 적합한 것을 찾는 것입니다 따라서 모델 실적을 향상시킬 수 있습니다 관리 관점에서 모든 것을 하나로 모으는 것은, 우리는 전체 ML의 모든 단계에 대해 다른 서비스를 가지고 있습니다 애플리케이션에 대해 처리해야하는 라이프 사이클 우리는 섭취 측, 전처리 측, 저장 및 탐색 및 실험, 시각화 측면, 모델 교육 및 제공, Data Studio를 사용하여 보고서를 만들 수 있습니다

그것 모두는 우리의 관리 서비스에, 당신은 인프라를 다룰 필요가 없습니다 모든 호출기를 관리하는 SRE를 보유 할 필요는 없습니다 이렇게하는 다른 방법은 직접 해보는 것입니다 자신 만의 솔루션을 선보일 수 있습니다 사실 몇 가지 매우 유효한 이유가 있습니다

왜 일부 고객은 이것을 원할 것입니다 당신은 연구자 일 수도 있고 당신 일 수도 있습니다 스택의 모든 부분을 변경할 수 있기를 원한다 원한다면, 당신은 매우 맞춤화 된 파이프 라인을 가지고 있을지도 모릅니다 또는 당신이 최첨단을 원할 수 있습니다

오픈 소스 소프트웨어는 당신이 원하는 시점에 펑크 난다 여러 가지 이유가 있습니다 너는 그걸 원할지도 모른다 그게 전부입니다 우리는 그런 사용자를 좋아합니다

하이브리드 구현도 가능합니다 어떤 것들은 클라우드에 있고 어떤 것들은 온 – 프레미엄입니다 매우 일반적인 사용 사례입니다 우리는 그것을지지하고자합니다 그래서 직접 해보고 그것을 배포 할 방법이 있습니다

정말 중요합니다 따라서 우리와 똑같은 인프라 이전에 관리되고 있던 동일한 종류의 오픈 소스 플랫폼을 자동으로 롤백 할 수 있습니다 자신의 인프라에서 너는 그것을 관리한다 그리고 당신은 똑같은 하드웨어를 갖게됩니다

다른 솔루션에 전력을 공급합니다 그래서 우리는 얻는 것이 정말 쉽습니다 깊은 학습으로 시작되었습니다 깊은 학습은 정말 이륙하고 있습니다 복잡한 데이터에서 통찰력을 찾는 정말 좋은 방법입니다

세트 또한 인증 및 최적화 된 VM 이미지를 제공합니다 GCE에서 일하기 상자에서 꺼내면 Jupyter Notebook을 얻을 수 있습니다 모든 하드웨어에 액세스 할 수 있습니다

크리스가 잠시 후에 얘기 할 것입니다 그리고 가능한 최상의 결과를 얻을 수 있도록 구성되었습니다 따라서 클릭 한 번으로이 항목을 배포 할 수 있습니다 원하는 기계에 접근하여 접근하기 당신이 원하는 모든 액셀레이터에게 즉각적으로 갈 준비가되었습니다

우리는 약속에 대해 언급했다 Google이 오픈 소스 커뮤니티에 미친 영향 Kubeflow는 제가 좋아하는 오픈 소스 프로젝트입니다 지난 가을에 Kubernetes에서 시작되었습니다 특정 ML 작업을위한 마이크로 서비스를 만들 수 있어야한다

분산 형 교육 또는 분산 형 당신이 원하는 곳마다 다른 종류의 모델을 제공하고, 그것이 GCP에 있든 또는 온 – 프레스에 있든 상관 없습니다 따라서이 컨테이너를 배포하는 데 매우 휴대 가능한 방법입니다 당신이 원하는 곳이라면 그런 식으로 배포 할 수 있습니다 일관된 GCP 또는 온 – 리소스 일치에 대해 걱정할 필요가 없습니다

Kubernetes가 그것을 처리하기 때문에 이 모든 것을 다룰 수있는 쿠버 넷 고유의 방식입니다 그리고 다시 CPU, GPU 및 TPU에서 작동하도록 구성되었습니다 GCE에 온 – 프레미스 (On-prem), 내부적으로 가지고있는 모든 것에 액세스 할 수 있습니다 그렇다면 GCE에 배포하면 어떻게 될지 모르겠습니다

GKE 클러스터를 생성하고, 그것은 GCP의 관리 Kuvernnetes 클러스터입니다 그러면 JupyterHub 노트북을 스핀 업할 수 있습니다 TensorFlow 교육 서비스 또는 기타 프레임 워크를 시작하십시오 너는 넣고 싶었고 똑같은 일을했다 당신의 TensorFlow 서빙을 위해

모든 사용자가 공유 저장소에 액세스 할 수 있습니다 GCP에서 Kubernetes에게 자연스럽게 따라서 실제로 할 수있는 좋은 방법입니다 이것은 매우 휴대용 방식으로 그런 다음 전체 컨테이너를 원하는 위치에 배치 할 수 있습니다 그리고 그것은 환상적인 해결책입니다

그래서 지금, 나는 시간을 보낼 것입니다 Chris에게 하드웨어에 대해 이야기 할 것입니다 크리스 클리브 : 감사합니다, 저스틴 테이크 어웨이로 돌아가서, ML에 흥미를 느끼고, Google 클라우드에 ML을 구현할 수 있다고 확신하면서 Google의 인공 지능 (AI) 포커스는 우리를 귀하의 ML에 적합한 파트너로 만들어줍니다 워크로드

정말 빨리 이야기 해 봅시다 단지 이러한 것들을 되풀이하기 위해서입니다 개발자이고 ML을 구현하려는 경우, ML 전문가가 될 필요는 없습니다 API 모델을 사용하십시오 위험을 낮추십시오

사전 훈련 된 ML 모델이 마음에 들지 않는 경우 또는 사용자 정의 무언가를해야합니다 AutoML과 함께 웹 브라우저를 사용하여 사용자 정의 ML 모델을 작성하십시오 놀라운, 슈퍼 간단합니다 그리고 데이터 전문가 또는 기계 학습 과학자 인 경우, 또는 도메인 전문가가 작업 부하에 적합한 도구를 제공합니다 게다가

Google 클라우드에 ML을 성공적으로 구현할 수 있습니다 그러나 컴퓨팅 및 인프라에 대해 간단히 이야기 해 봅시다 ML과의 관계 최근 AI 개선 및 발전의 80 % 더 많은 이용 가능한 컴퓨팅 성능에 기인 한 것입니다 그러나 최근의 TensorFlow 이벤트에서, 설문 조사에 따르면 사람들이 접근 할 수 없다는 것을 인정합니다 ML 연구를 위해 충분히 계산할 수 있습니다

그것은 분명한 문제입니다 이제 수십 년 전으로 돌아 가자 왜냐하면 우리 모두 우리가 서있는 ML에서 일하는이 방에서 거인의 어깨에 신경망과 ML의 작동 방식에 대한 개념, 수십 년이 지났습니다 인간의 두뇌를보고, 어떻게 뉴런이 서로 연결되어 있는지, 그들이 정보를 전달하는 방법 한 뉴런에서 다른 뉴런으로, 그것은 오래된 개념입니다

하지만 최근의 구현입니다 대규모 데이터 센터 및 하드웨어 가속기 우리가이 큰 신경 네트워크를 만들 수있게 해줬습니다 ML의 발전 인프라가 중요합니다 그리고 그것이 중요한 이유는, 당신이 어떤 길로 가든 상관없이 – Google ML 모델을 사용하여 맞춤 모델 만들기 – 그것을 지탱하고있는 인프라입니다

우리 모델에서는 이미 데이터를 가져 왔습니다 훌륭한 알고리즘을 통과 시켰습니다 이 인프라, 대규모, 축구 규모의 현장 데이터 센터 이 모델들을 더 좋고 더 좋게 만드십시오 그리고 우리는 계속 그렇게 할 것입니다 Google Cloud를 사용하면 그 같은 규모로, 너와 그것을 할 수있는 것과 똑같은 힘 알맞게

GCP에 관한 새로운 ML 고객 중 한 명 OpenAI이고 대규모에 대해 이야기합니다 그들은 관리되지 않는 길로 갔다 그들은 도메인 전문가이고, 그들은 AI 사고 리더입니다 그들은 비영리 단체입니다 AI로 혁신하고 개방적이고 안전하게 만들기 위해 노력하고 있습니다

그들은 10 만개 이상의 프로세서를 사용합니다 보강 학습을 할 수 있습니다 수천 개의 GPU를 사용하여 기계 학습을하고 있습니다 혁신을 가능하게하는 것은 규모에 대한 접근입니다 그 (것)들을 위해 그것을 제공하고있는 Google Cloud입니다

하드웨어 가속기는 매우 중요합니다 하드웨어 혁신뿐입니다 CPU가 있으면 Skylake를 사용할 수 있습니다 그러나 ML 작업 부하의 경우 분산 된 교육의 경우 커다란 교육 일자리가 생기면 마비 된 계산 능력이 필요합니다 따라서 우리는 역사적으로 2017 년 2 월 이후로, 우리는 세 개의 NVIDIA GPU 모델 인 K80, P100, V100, 고성능, 패스 스루 PCI입니다

V100을 사용하면 NVLink 상호 연결이 가능하며, ML 워크로드에 아주 좋습니다 우리가 조금 다른 것보다 우리의 경쟁 업체는 맞춤 VM을 제공하는 방식을 사용합니다 CPU 사용량, 메모리 사용량, 기타 GPU 유형, 보유하고있는 GPU 수, 원하는 VM 수, 네트워크 연결 스토리지를 사용하거나 고속 디스크를 원할 경우 특정 작업 부하에 대한 I / O, 서버 내 SSD 연결, 그리고 당신이 원하는 것을 지불하십시오 또는 병목 현상이있는 경우 그 중 하나를 조정하십시오 우리의 다른 경쟁 업체 중 일부는 유연성을 제공하지 않습니다

그래서 돈을 저축하려고합니다 ML 작업이 더 빨리 진행될 것입니다 사실은 이번 주에는 새로운 P4 GPU를 출시했습니다 일주일 후에 나올거야 ML 추론 워크로드에 유용합니다

따라서 우리는 파트너 인 NVIDIA와 계속 협력 할 것입니다 새로운 GPU를 시작하십시오 그래서 우리는 거기서 멈추지 않습니다 AI에 초점을 맞추면 TPU가 생깁니다 우리는 Cloud v2 TPU를 작년에 만들었습니다

이것은 기계 학습을 위해 의도적으로 제작 된 ASIC입니다 그리고 오늘, 우리는 몇 가지 새로운 발표를했습니다 v3이 나오고, 빠르고 저렴한 ML 작업 부하 TPU 포드가 있습니다 TPU 포드는 일련의 TPU입니다

빠른 네트워크로 연결됩니다 다시 한번, 구글의 AI는 인프라를 구축하는 데 중점을두고 있습니다 우리는이 ML 모델을 더 빨리 교육하고 있습니다 우리는 또한 당신에게 그것을 제공하고 있습니다 우리는 당신의 ML을위한 올바른 파트너라고 믿어야합니다

워크로드 저축은 많은 돈입니다 많은 회사에 크고 큰 거래 스탠포드에 예산이있는 조교수가 있습니다 ML에서 몇 가지 연구를 수행합니다

그리고 그는 고정되어 있습니다 – 그가 할 수있는 일은 너무 많아 따라서 관리되지 않는 경로의 윈 – 윈 제품 – 선점 형 VM, 선점 형 GPU 및 TPU가 있습니다 때로는 여분의 용량이 있습니다 또한 교육 및 추론과 같은 ML 배치 워크로드, 우리는 GPU와 TPUs의 70 % 할인을 제공하고 오늘 아침에 발표했습니다 TPUs의 가격을 인하했습니다

그래서 지금,이 연구원은 우리의 여분의 수용력을 사용할 수 있습니다, 약간의 비용 절감, 배치 워크로드 실행 모든 사용 사례에 해당하는 것은 아닙니다 보장되지 않습니다 항상 거기있는 것은 아닙니다 하지만 연구를하고 있다면 필요한 일이나 큰 조직을해라 배치 작업 부하가 한 번씩 적은 비용으로 더 많은 혁신을 할 수있는 좋은 방법입니다

ML에서는 데이터가 정말로 중요합니다 Google은 훌륭한 광섬유 네트워크, 훌륭한 인터넷 서비스를 제공합니다 사이 따라서 데이터를 큰 단위로 이동하는 경우, 우리는 그것을 처리했습니다 실시간으로 들어오는 대규모 데이터 흐름이 다양한 출처 – 우리는 전 세계에 구름 위치를 가지고 있습니다

일부 데이터를 우리에게 발송해야하는 경우, 우리는 당신이 대량으로 출하 할 수있는 가전기구를 가지고 있습니다 그것은 단순한 계산이 아니라 훌륭한 인공 지능 서비스입니다 그것은 네트워크입니다 보안입니다 그것은 거기에 내장 된 모든 것입니다

그래서 우리는 많은 인공 지능 서비스에 대해 이야기했습니다 우리는 당신에게 개요와 소개를주었습니다 우리는 ML이 불가능 발명에 관한 것이 아니라는 것에 대해 이야기했습니다 그것은 재상영과 재발생에 관한 것입니다 너 오늘하고있는 일

현재 14,000 명이 넘는 고객이 GCP에서 ML을하고 있습니다 오픈과 하이브리드에 중점을두고, 및 멀티 클라우드 작업 부하, 하드웨어에 중점을 둠, 우리가 발표하는 우리의 새로운 서비스, 그리고 언급 한 기조 연설, 새로운 AutoML 서비스, 고품질 API – 네가 어떻게하고 싶은지 상관 없다 당신이 할 수 있다는 것에 흥분을 느껴야합니다 당신은 당신이 성공적으로 그것을 할 수 있다고 확신해야합니다 Google은 귀하에게 적합한 파트너입니다

더 배우고, 시작하고, 얻을 수있는 여러 가지 방법이 있습니다 세워짐 내가 특별히 말하고자하는 것은 내가 개인적으로 Kaggle이 사용되었습니다 Kaggle은 ML 대회 서비스 및 커뮤니티입니다 나는 ML을 배울 때, 내가 뭘하는지 몰랐다

그리고 이미지 인식 경쟁이있었습니다 운전자가 도로에주의를 기울이거나 또는 산만 한 느낌 그래서 커뮤니티에 가입하여 ML 도전에 합류했습니다 TensorFlow를 사용하는 방법에 대한 많은 리소스가있었습니다 및 데이터를 사전 처리하는 방법

그리고 Google은 Kaggle을 사용하여 전 세계 사람들을 돕고 있습니다 ML을 배우십시오 그리고 너도 그걸 쓸 수있어 또는 데이터 세트가 많은 조직의 경우, 당신은 경쟁을 시작할 수 있고 세계의 ML 전문가를 가질 수 있습니다 너를 위해 ML을해라

방법에 대한 자료가 많이 있습니다 이러한 서비스에 대해 알아보십시오 Google Cloud 고객이 아닌 경우 무료 크레딧이 제공됩니다 이미 그래서 그 점에 대해 감사 드리고 싶습니다

우리 시간은 거의 다됐다 우리는 몇 가지 질의 응답을 할 것입니다 양쪽에 2 개의 마이크 그리고 몇 가지 질문을하십시오 고마워요

[박수 갈채] [음악 재생]