Google Cloud AI Huddle

[음악 재생] PUNEITH KAUL : Robbie를 소개하고 싶습니다 Robbie는 Google Cloud AI 플랫폼의 기술 선도자이며, 그리고 팀 창립 멤버 중 한 명

그는 Cloud Machine의 첫 번째 [INAUDIBLE] 백엔드를 구축했습니다 Learning Engine 서비스, 현재 그는 ML 예측과 관련된 서비스, ​​기계의 다른 영역에서 작업하는 것을 좋아합니다 학습 및 클라우드 플랫폼 Google에서 근무하기 전에 그는 공부했습니다 통계적 자연 언어 처리, 기계 학습 분야의 논문에서 최고점에 달한다

능동 학습이라고합니다 로비, 바깥 근무 시간에 그의 아이들과 시간을 보내기를 좋아합니다 그는 사랑스러운 다섯 명의 아이들을 낳았습니다 그것에 대해 매우 열정적입니다 나는 지난 2 년 반 동안 Robbie를 알았고, 로비보다 더 잘 할 수 없었습니다

Robbie, 제발 [박수 갈채] 알았어 그 소개 주셔서 감사합니다, Puneith 내 이름은 Robbie Haertel이야 나는 여기에있게되어 정말로 기쁩니다

그냥 네가 채울 거란 걸 알아 – 우린 계속 말하고있어, 이봐, 우리는 피드백을 원합니다 blah, blah, blah, blah, blah

그 라인을 따라 몇 가지 질문 비공식적으로, 여기서 얼마나 많은 사람들이 그들의 역할을 고려할 것인가? 데이터 과학자가 되려면? 그들의 회사에서 그들의 주요 역할 그것은 좋은 숫자이지만, 심지어는 그렇지 않을 수도 있습니다 절반, 또는 절반 이상을 차지하십시오 데이터 엔지니어는 어떻습니까? 그거 고려해? 같은 손의 일부가 올라갔습니다

전에 말해줬으면 다른 하나를 골랐어 요 권리? 일부 데이터 엔지니어가 있습니다 소프트웨어 엔지니어는 어떨까요? 그래서 그것은 많은 사람들입니다 소프트웨어 엔지니어, 기계 학습이 어쩌면 여기 있니? 당신이 찾고있는 취미 또는 무언가 들어가기 위해 당신은 당신의 경력에서 그 길을 갈 수 있습니까? 그게 네가 여기있는 이유야? 다른 이유로 여기있는 사람은 누구입니까? 피자 때문에? 피자를 먹으러 온 사람 있어요? 그래서 내가 왔어 그들은 무료 피자를 먹을 수 있다고 말했다

하지만 너는 대화를해야 해 나는 가치가 있다고 말했다! 그래서 여기 있습니다 관객 : 시작하고 있습니다 ROBBIE HAERTEL : 신생 기업을하고 있습니까? 그래서 당신은 여기에 무엇이 제공되는지 알아 내려고합니다 권리? 관객 : 예

로비 헤르 텔 : 아주 멋지다 관객 : 그리고 어떻게 우리에게 보여줄 수 있습니까? Google 이중화를 구현 하시겠습니까? [웃음] 로비 헤르 텔 : 글쎄, 기대를 설정합시다 언급했듯이, 저는 클라우드 AI의 리드 중 하나입니다 플랫폼 팀, 우리 일은 여러분을위한 플랫폼을 제공하는 것입니다 기계 학습을 할 수 있습니다

그래서 내가 여기 있다고 생각하면 정말 멋진 모델을 훈련시키는 법을 보여줄 것입니다 가장 높은 정확도, 그리고 여기 sklearn에서하는 트릭이 있습니다 XGBoost에서 조정할 수있는 하이퍼 매개 변수는 다음과 같습니다 아마도 당신은 올바른 말을하지 않았을 것입니다 어쨌든, 머무를 수 있기를 바랍니다

어쨌든, 머물길 바랍니다 하지만 내가 당신을 보여주기 위해 여기에있는 것은 클라우드 내 모든 이메일이 올라 오는 것처럼 보입니까? 클라우드 AI 플랫폼이 여러분을 위해 무엇을 할 수 있는지, 애호가, 배우려고하거나, 당신의 일을 끝내려고 노력하는 데이터 과학자로서, 시작으로 클라우드 오프는 신생 기업에게 많은 이점을 제공한다고 생각합니다 사실은 여기 얼마나 많은 사람들이 자신을 고려할 것인가? 창업을 위해 일하는거야? 나는 손을 들어 올릴거야

있잖아, 뭘? Google은 시작이 아닙니다 하지만 알다시피, 클라우드 AI 플랫폼 – 이것은 비교적 새로운 영역입니다 나는 그들이 존재했다는 것을 안다 Google, 실제로 – 나는 Google에서 인턴 과정에 근무했습니다 Prediction API로 알려진 것

우리는 최근에 그것을 거절했습니다 그러나 그것은 최초의 퍼블릭 클라우드 중 하나였습니다 기계 학습 오퍼링 그리고 나는 그것이 실제로 거절당한 것을보고 슬퍼했습니다 내가 그 일을했기 때문에

나는 그것이 실제로 그 시간보다 훨씬 앞서 있다고 생각한다 그리고 그것은 아마도 아직도 그 시대보다 앞서 있습니다 우리는 아마 몇 년 더있을 것입니다 우리가 여기서의 약속을 깨달을 때까지 가야합니다 CSV, 여기 훈련받은 모델이 있습니다

그러나 어쨌든, 그것을 즐겁게 해주셔서 감사드립니다 이걸 설정해 주셔서 고마워요 나는 그 일을 스스로 할 수 있다고 생각하고 싶습니다 여기에서 시작하는대로, 사람들에게 특별한 감사를드립니다 여기에있는 슬라이드와 데모를 도와주었습니다

나는 다음 사람들 없이는 그것을 집어 넣을 수 없었다 노아 그레고리, 권영희, 부페시 찬드라, 캐티 탕, 지금 청중에있는 사람 나머지 클라우드 AI 플랫폼 팀

그래서 나는 정말로 모든 도움에 감사한다 그들은 데모와 물건을 나에게 주었다 그리고 물론, 특별 감사합니다 이 회의를 조직 한 사람들에게, 참석하신 모든 분들께 감사드립니다 피드백 제공 주제로 돌아 가기

Puneith가 언급 한 것 같아 클라우드 AI 플랫폼은 약 3 년 전에 시작되었습니다 따라서 우리는 사용자들과 함께 일하는 경험을 가지고 있습니다 요구 사항 및 요구 사항 파악 그것들을 이해하려고 노력합니다 즉, 우리는 초기 단계에 있다고 믿습니다

우리가 할 수 있고해야할 일이 훨씬 더 많다는 것입니다 사실 우리는 우리가 가설 테스트 단계에서 그리고 우리가하고 싶은 것은 – 우리는 일정한 가정을했습니다 그리고 우리가 당신과 이야기 할 때, 우리가 잘못했다고 생각한 몇 가지 가정을 발견하면, 나중에 우리 중 한 명에게 와서 말하고 싶습니다 이것에 관해서? 이런 식으로 생각 했니? 아니면 이봐 요, 그거 알아? 우리의 요구 사항은 실제로 조금 다릅니다 이것을 제공하는 것에 대해 생각해 보셨습니까? 우리는 그 것들을 이해하고 정말로 싶습니다

왜냐하면 우리가 사용할 수없는 플랫폼을 구축한다면, 나는 내 인생의 마지막 3 년을 낭비했다 그리고 저는 뭔가 유용한 것을하려고 노력하고 있다고 생각하고 싶습니다 그리고 지난 3 년 동안 내가 실패하더라도, 나는 뭔가를 짓는 길을 계속하고 싶다 너희들이 사용할 수있는 것들 언급 된 바와 같이, 화제의 주제는 – 글쎄, 나는 주제를 약간 변경했다

그러나 그것은 Production scikit-learn과 XGBoost입니다 클라우드에서 클라우드 밖에서 사용하는 경우에 대해 간단히 설명하겠습니다 하지만 너희들, 너희들 대부분 여기, 너의 약 절반 네가 데이터 과학자라고했다 여러분 중 일부는 취미 생활을하거나 대학원에서 ML을했으며, 그래서 당신은 이것에 매우 익숙합니다 내 마이크가 아직 켜져 있습니까? 나는 그것이 벗어난 것처럼 느낀다

우린 여전히 괜찮아? 승인 너희들이 아마이 일에 대해 나에게 설교 할 수있을거야 이것은 내 견해입니다 나는 그것에 많은 시간을 할애하지 않을 것이다 왜냐하면 네가 그걸 잘 알고 있다고 믿기 때문이야

모델 개발주기는 다소 비슷합니다 해결할 문제가 있습니다 해당 문제를 해결하는 데 도움이되는 데이터를 수집합니다 거의 항상 데이터를 정리해야합니다 그런 다음 어떤 모델을 사용할지 결정합니다

그것이 이미지 분류 또는 일종의 지각이라면 문제, 오디오, 어쩌면 일부 텍스트, 당신은 신경 네트워크를 사용할 수 있습니다 그러나 클릭률 예측 인 경우, 로지스틱 회귀를 사용할 수 있습니다 구조화 된 학습이라면 아마도 그라디언트를 높이는 의사 결정 트리를 사용합니다 현장에있는 당신들 이 모델이 잘 작동한다는 것을 이미 충분히 알고있다 이런 종류의 문제

그럼 나에게이 원시 데이터를 가져 가야 해 당신이 청소하고 분석하고 수집 한 당신은 몇 가지 기능 엔지니어링을해야합니다 특히 로지스틱 회귀 또는 일종의 선형 모델의 경우 양자화가 필요할 것입니다 one-hot 인코딩 당신은 십자가 모양을 할 필요가 있습니다

모든 종류의 것들 특정 유형의 기능에 대한 로그, 모든 종류의 것들 일단 작업을 완료하면 이제 데이터 세트를 가져올 수 있습니다 모델을 훈련시킬 수 있습니다 대부분의 모델에는 하이퍼 파라미터가 있습니다 그리고 당신의 목표는 모델을 얻지 않는 것입니다

모델을 고려할 때 가능한 최상의 모델을 얻는 것입니다 선택 및 기능 세트 그래서 당신은 그것을 훈련시킬 것입니다 하이퍼 파라미터 튜닝을 할 것입니다 하루가 끝나면 모델이 생깁니다

그리고 그 모델을 선택하면 결과를 분석 할 것입니다 이봐,이 모델은 뭐래? 성공은 어디입니까? 실패한 곳은 어디입니까? 더 나은 모델을 얻으려면 어떻게해야합니까? 오류가 무엇인지에 따라 보시다시피, 당신은 결정할 수 있습니다, 아, 충분한 데이터가 없습니다 또는 내 데이터가 충분히 깨끗하지 못했습니다 또는 더 많은 기능이나 다른 기능을 추가해야합니다 아니면 다른 모델 클래스가 필요합니다

어쨌든이 기능 엔지니어링주기를 거치십시오 또는 모델 개발주기, 그리고 무엇? 당신은 모델로 끝납니다, 그렇죠? 책상 위에 누워있는 모델이 있습니다 이제 뭐? 따라서 모델을 훈련하는 것은 단순히 끝을 맺는 수단 일뿐입니다 그것은 그 자체로 끝이 아닙니다 우리는 흥미로운 것을하고 싶기 때문에 모델을 훈련합니다

문제는 네가 얼마나 많은지 보자 이 짹짹과 관련이 있습니다 "엔터프라이즈 머신 러닝 이야기 – '3 주 정도 걸렸습니다

모델 개발 " 너무 나쁘지 않습니다 아마 맞을 것 같습니다 그녀는 아마 데이터를 준비하는 데 얼마나 오랜 시간이 걸렸을까요? 하지만 우리는 그녀에게 그 사실을 알릴 것입니다 "11 개월이 넘었으며 아직 배포되지 않았습니다

" 너희 중 많은 사람들이 이것과 관련 될 수 있니? 어쩌면 11 개월 대신 6 개월입니다 아마 20 개월이 걸릴거야 그러나 어쨌든 데이터 부분을 무시하십시오 왜냐하면 우리 모두 그게 어렵고 힘든 일이라는 것을 알아라 모델을 프로덕션으로 가져 오는 것 실제로 모델을 훈련하는 것보다 훨씬 더 오래 걸립니다

그리고 얼마나 많은 사람들이 재미있는 부분을 얻고 있는지 생각합니다 생산 모델로? 제 생각 엔 당신이 여기 온 이유가 재미있는 부분이 모델을 만들고 있기 때문입니다 맞습니까? 이것은 스크린 샷이며보기가 매우 어렵습니다 Jupyter 노트북의 모델을 훈련하기 위해 실행 한 코드를 가져 가면 어떨까요? 버튼을 클릭하면 생산중인 모델? 나는 네가 할 수 있음을 분명히 말하고있다

그리고 네, 저는 Pixelbook에 Jupyter 노트북을 달고 있습니다 Chromebook을 여기에서 실행하려는 사용자를위한 플러그인입니다 실행중인 예를 들어 보겠습니다 이를 사용하여 클릭 연결 모델을 교육하십시오 죄송합니다

클릭률 예측 모델입니다 기본 학습자로 XGBoost를 사용하려고합니다 그리고 나는 몇몇 sklearn 파이프 라인을 사용할 것입니다 다시 말하지만, 만약 당신이 이것을하는 방법에 관한 비밀스런 소스를 보러왔다면, 당신은 심하게 괴롭히고, 실망하게 될 것입니다 너희들이 돌아와서 말하기 때문에, 왜 이러지 않았 니? 왜 그걸하지 않았 니? 왜 안했어? 사실,이 예제는 GitHub에있을거야

앞으로 나아가서 당신의 마음의 욕망에 충실하십시오 우리는 그 의미에서 합당한 제출물을 받아 들일 것입니다 우리가 사용하는 훈련 데이터는 Criteo 샘플입니다 11 기가 바이트라고 생각합니다 공개적으로 사용할 수있는 클릭 수 데이터 7 일분 그것은 Kaggle 도전에 사용되었습니다

여기 코드를 보면 그냥 아주 표준적인 일을하고있어 나는 예제를 지나치게 단순하게 유지하려고 노력했다 설명을 위해서 우리는 몇 가지 주장을 분석하고, 단지 그들이 다시 나타나기 때문에 – 나는 여기서 너무 많은 시간을 보내고 싶지 않다 기본 디렉토리는 일종의 로그이므로 로그가 어디에 있는지 알 수 있습니다

따라서 모델 및 해당 형식을 내보낼 위치를 알 수 있습니다 사물의 그리고 나서 행사 날짜는 내가 할거야, 주어진 날짜, 나는 7 일 동안 되돌아 볼 것입니다 지난 7 일간 새로운 모델을 훈련시키고, 그런 다음 거기에서 나가십시오 승인? 이건 속임수 같아 최대 샘플은 7000입니다 내가 Pixelbook에 있다는 것을 상기해라

나는 훈련 할 수 없을거야 7 일 분량의 데이터에 대해 조금 후에 목적을 강조 할 것입니다 이 작은 아름다운 코드 블록 단지 데이터를 읽는 중입니다 그리고 너는 너 같은데, 왜 팬더를 쓰고 있니? 나는 그 세부 사항에 들어 가지 않을 것이다, 그러나 이유가있다 올바른 데이터 형식을 얻으려면 dict 벡터 라이저를 사용할 수 있습니다

다음은 XGBoost 회귀 분석기입니다 분명히 XGBoost 모델을 교육하고 있습니다 로지스틱 회귀와 비슷합니다 그리고 나서 우리는 sklearn 파이프 라인을 만듭니다 사전 벡터 라이저가 있습니다

범주 형 기능을 돌릴 것입니다 우리를 위해 원 핫 인코딩을해라 나는 파이프 라인에 전화한다 우리가 손가락을 통과하면 작동한다 우리는 반드시 그것이 끝날 때까지 기다릴 필요가 없다

하지만 그렇게 오래 걸리지는 않을거야 작은 데이터와 모든 것들 그것은 끝났다 근본적으로 한 줄의 코드를 사용하면 모델을 저장하십시오 네가 모두 어떻게 익숙해 졌는지 확신 해

모델 피클하기 그리고이 명령은 여기 있습니다 – gsutil – 파일 복사 명령 일뿐입니다 클라우드로 이동하십시오 왜냐하면 cp를 사용하려고하면 분명히 그것을 클라우드로 가져 오는 방법을 알지 못할 것입니다 그래서 우리는 모델을 저장합니다

우리는 그것을 구름에 복사했습니다 이제 실제로 모델을 배포해야합니다 클라우드에서 서비스로 이 두 명령으로 우리가하려고하는 것 여기, 당신을 위해 REST API를 만들 것입니다 그러면 예측 요청을 보낼 수 있습니다

그리고 그것은 모든로드 밸런싱을 수행합니다 그것은 모든 자동 스케일링을 수행하고, 웹 서버를 가지고 있으며, 인증, 권한 부여, 예측 등 우리는 그것에 대해 더 이야기 할 것입니다 어쨌든 슬라이드의 일부를 응축시킬 수 있습니다 몇 분 후에 여기이 첫 번째 줄에는 개념이 있습니다

모델이라고하는 현재 서비스에서 본질적으로 버전 모음 우리는 이것이 훈련의 맥락에서 어떻게 매일 새로운 모델을 사용하면 다양한 버전을 유지할 수 있습니다 그들 사이를 전환하십시오 내가 어제의 모델을 제공하고있는 것처럼, 이제 저는 오늘날의 모델을 제공해야하지만, 당분간, 그것을 컨테이너라고 생각하십시오 이 모델을 만듭니다

내가 다시하면 오류가 발생합니다 고유해야하기 때문에 실행하지 않을 것입니다 이제 cURL 인이 엉망은 거기에 없을 것입니다 약 1 ~ 2 주 만에 방금 명령 줄 도구가 있습니다

프레임 워크를 명령으로 받아들이도록 업데이트했습니다 거기에는 없었습니다 따라서 모델의 create 명령과 본질적으로 매우 유사합니다 하지만 버전이 만들어집니다 그래서 우리는이 모델의 버전을 만들어야한다고 말하고 있습니다

그리고 내가 버전을 v4로 올렸으므로, 이것을 실행할 때, 그것은 실제로 구름으로 가고 있습니다 그리고 당신이 할 수 있기 때문에 상상할 수 있습니다 내가 말했던 모든 것들 – 로드 밸런싱, 웹 서버, ㅋ, ㅋ, ㅋ, ㅋ, ㅋ, 그것은 조금 걸립니다 그러나 우리는 실제로 매우 빠릅니다 중간 시간은 90 초라고 생각합니다

당신의 첫 번째 모델은 조금 더 있을지도 모릅니다 시간은 5 분 정도 더 걸릴 것입니다 하지만 약 1 ~ 2 분이 소요됩니다 그래서 우리가 그 일을하는 동안 슬라이드 덱으로 돌아 갑시다 이제 우리는 컨텍스트 스위치를 사용해야한다는 것을 알고 있습니다

엔지니어입니다 소프트웨어 엔지니어 – 당신은 그 참조를 이해합니다 그러나 문제는 생산이 왜 그렇게 긴 장대입니까? 기억하십시오, 그것은 고통의 포인트 중 하나였습니다 우리가이 이야기에서 말하고있는 것, 모델을 생산에 적용하기가 어렵다는 것입니다 나는 너희들에게 그 질문을 열어보고 싶었다

그 이유 중 일부는 무엇입니까? 모델이 생산에 들어갈 때까지 오랜 시간이 걸린다 너의 경험에? 데이터 가져 오기? 일단 모델을 얻으면 어떨까요? 데이터를 얻었으므로 모델을 훈련하십시오 당신이 정말로 원하는 것은 영향을 보여주는 것입니다 더 나은 실적 검토 점수 또는 기타 사항을 얻으려면 그런 식으로 또는 유효성 검사? 글쎄, 그건 좋은 지적이야

네 그리고 나는 너무 많이 말하지 않는다 나는 그 슬라이드 중 하나에 대해 암시한다 하지만 너는 무언가를 넣지 않을거야 멍청한 제작에

시스템을 꺼내십시오 다른 이유가 있습니까? 청중 : 성과 평가 ROBBIE HAERTEL : 절대적으로 성능 평가 관객 : 당신도 말을 할 수 있다고 말 했잖아요 무언가 잘못되었을 때 등을 맞댄

그래 헤이즐러 : 네 관객 : 당신도 그것을 준비해야합니다 그래 헤이즐러 : 네

안전한 롤백을 할 수 있어야합니다 아주 좋아 여기로? 관객 : 인프라 관리 [INAUDIBLE] 그래

헤이즐러 : 네 얼마나 많은 사람들이 당신이 좋아하는 일을해야한다고 생각하십니까? 인프라를 관리하는 것인가? 그게 내가 여기있는 직업이야, 맞지? 그러는 중 정확하게 나는 방에있는 유일한 사람일지도 모른다 여기에 몇 가지 다른 것들이 있습니다

너희들 정말 멋진 것들을 말했다 나는 이것에 대해 열심히 생각조차하지 않았다 이것들은 내 혀의 끝 부분에서 나온 것들입니다 또는 손가락 승인을 받아야합니다

용량 계획을 수행해야합니다 어떤 사람들은 사실 나는 대화를 나누었습니다

나는 그것이 지금 누구인지를 기억할 수 없다 하지만 당신은 당신의 모델을 변환해야합니다 한 형식에서 다른 형식으로, 그런 다음 그 유형에 대한 유효성 검사를 수행하십시오 기술적 인 문제가 있습니다 누군가는 서빙 시스템을 만드는 것만 언급했다

매우 복잡한 스택입니다 로드 균형 조정이 있습니다 웹 서버가 있습니다 당신은 인증을 가지고 있습니다 권한이 있습니다

캐시가있는 경우가 많습니다 로깅 에이전트가 있습니다 모니터링 에이전트가 있습니다 그들은 모두 함께 일해야합니다 한가지는 그것들 모두를 얻는 것입니다

또 다른 한 가지는 모든 것을 유지하는 것입니다 그 조각들 중 하나라도 떨어지면, 그것은 당신의 호출기입니다 당신이 생산 엔지니어라면 그리고 아마 그런 일이 일어나기를 원하지 않을 것입니다 그리고 확실히 데이터 과학자 인 여러분, 비록 당신이 이것을 할 능력이 있더라도, 아마도 지구상에서 마지막으로해야 할 일입니다

그렇지 않으면 프로덕션 엔지니어가되고 데이터 과학자 그래서 여기에 클라우드 ML 엔진 예측이 제공하는 것이 있습니다 클릭하여 배포 할 수 있습니다 가로 자동 ​​크기 조정 기능을 제공하므로 발송할 때 더 많은 트래픽이 발생하면 확장됩니다 당신은 더 적은 트래픽을 보내고, 그것은 줄어든다

서버리스이기 때문에 최대한 확장됩니다 0으로 설정하면 정말 환상적입니다 시작 및 트래픽 패턴 처음 단계에서는 매우 드물다 너는 약간 소통량을 얻고 너는 행복하다 정말 낮아지고 당신은 그렇게 행복하지 않습니다

또는 매우 뾰족한 교통 우리는 매우 빠르게 확장됩니다 우리 서버는 실제로 세계 최고 수준으로 확장 할 수 있습니다 암호화, 인증, 권한 부여, 로깅, 모니터링 레이블로 모델을 구성 할 수 있습니다

버전 롤아웃과 그 일을 할 수 있습니다 그럼 우리가 다시 여기로 가자 Jupyter 노트북이므로 멋진 원형 표시를 얻지 마라 나는 그것을 할 수있는 좋은 연장이 없다 그러나 우리는 계속 진행할 수 있으며 트래픽을 보내기 시작할 수 있습니다

따라서이 코드 조각이 정말로이 4 개의 선 (그것은 본질적으로 하나 다)에 이르기까지 비등한다 정말 긴 줄이 있기 때문에 헤어 졌다고 생각합니다 읽기가 어렵다 또는 정말로 두 줄 당신은 서비스에 대한 연결을 생성하고, 당신은 execute, 당신은 그것을 데이터로 전달합니다

이 예제 – 그 길에서 명확하지 않다 Jupyter 노트북을 정리했습니다 문자 그대로 같은 데이터 구조입니다 로컬 예측에 사용됩니다 승인

그것은 분명히 번역 될 것입니다, 이를 위해 REST API를 설정했기 때문에 JSON에 전달해야합니다 그리고 운이 좋으면 이전 라운드에서 볼 수 있습니다 그들은 둘 다 동일했다 라이브 데모에서 손가락을 계속 교차시킵니다 그리고 나는 신임장에 대한 경고를 받는다

그렇지 않으면 우리는 같은 가치를 얻습니다 나는 지역 예측을 비교하고있다 pipelinepredict 내가 sklearn 파이프 라인을 가지고 있다는 것을 상기해라

그리고 나는 클라우드 예측 (Cloud Prediction)이라고 부릅니다 구름에서 그걸 잡아라 매우 빠르고 대기 시간이 짧은 응답 시간 글쎄, 우연히 일어 났을거야 그러나 만약 그것이 0으로 축소 되었다면, 그 요청은 조금 걸렸을거야

더 이상 서버를 가져올 수 없습니다 그러나 그것은 매우 빠릅니다 승인 이제 이야기의 다음 섹션으로 넘어 갑시다 그래서 그것은 예측입니다

제가 말했듯이, 전제는 당신이 모델을 가지고 있다는 것입니다 파이프 라인과 XGBoost와 같은 Sklearn 기능을 결합했습니다 기본 모델로 sklearn이 제공해야하는 모델을 사용할 수 있습니다 sklearn이 제공해야하는 변형 중 하나

본질적으로 버튼 클릭 그리고 우리는 GUI로 작업하고 있습니다 내 생각에 구현 된 것 같아 말 그대로 버튼을 클릭하십시오 모델을 가리키고 있습니다

생산 규모에서 생산에 종사하고 있습니다 그리고 당신은 호출기를 쓰지 않습니다 그럼 MLOps에 대해 조금 이야기 해 봅시다 이 별표 작전은, 당신이 원한다면, 정렬입니다 업계의 전문 용어 중 하나입니다

우리는 데이터 작업을 가지고있는 개발 작업을했습니다 PSYOP가 있습니다 다른 작전이 뭔지 모르겠다 물론 MLOps가 있습니다 이유는 무엇입니까? 그래도 우리가 의미하는 바는 무엇입니까? 나는이 도표를 좋아한다

내가 어떤 사람들의 종이에서 그것을 훔치지 않았다면 Google에서 여기에서 일하면서 조금 다른 상자를 선택했습니다 그러나 나는 그것이 매우 요점을 설명하는 역할을한다고 생각한다 MLOps가 무엇인지 잘 설명합니다 그 작은, 어린, 십대에주의를 기울일 수 있다면, 화면의 중앙에있는 작은 상자가 ML 코드입니다 그것이 당신이 일자리의 일부로 쓰는 코드입니다

모델을 실행하는 것 다른 모든 것들은 그것입니다 봉사하고, 봉사하는 것이 아니라, 생산 시나리오에서 ML을 교육하고 사용하는 것입니다 물론, 만약 당신이 그냥 장난하고, 연구 논문과 같이, 그리고 당신은 마지막 녀석보다 더 정확한 모델을 얻어야 해 이 도메인에 논문을 발표했다

너는이 모든 것들을 필요로하지 않는다 Jupyter 노트북에서 할 수 있습니다 Colab, Kaggle Kernels 또는 좋아하는 Jupyter를 사용하십시오 노트북과 그것을 끝내라 프로덕션에서 무언가를하려고한다면, 거기에 들어가는 많은 일이 있습니다

너희들은 아마 데이터에 대해 잘 알고있을거야 수집 단계, 아마 구성도 분명히 생산 시스템에서의 피쳐 추출 실행해야하는 서비스입니다 지속적으로 운영되고 있습니다 우리는 귀하의 서비스 인프라, 우리는 이미 방법에 대해 약간 더 자세히 들어갔다

될 수있는 복합체 자원 모니터링, ㅋ, ㅋ, ㅋ, 어쩌구 프로덕션에 많은 도움이됩니다 MLOps라는 용어를 정의 할 때 – 개발자 작업이라는 용어를 정의하면 소프트웨어 개발 프로세스 병합 소프트웨어 작업 그래서 나는 실제로 그 정의가 MLOps를 기다리십시오

왜? 왜냐하면 우리가 옵스를 꺼내야한다고 생각하기 때문에 ML의, 그래서 생산 시스템을 제공하는 우리의 직업 작은 검은 색 상자와 비슷합니다 주위의 모든 것을 좋아하십시오 인프라를 보자 다른 사람이 그 일을하도록하십시오 다른 사람이 호출기를 들고 다니도록하자

그래서 이것이 우리의 목표입니다 내가 생각하는 것을 개관 해 줄게 MLOps에 대한 단계가 있어야합니다 대부분의 작업은 MLOps에서 제거됩니다 첫 번째 단계는 모델을 개발하는 것입니다

그게 당신 시간의 99 %가되기를 바랍니다 당신은 최고의 모델을 얻기 위해 3 주를 보낼 것입니다 당신의 데이터에서 벗어날 수 있습니다 프로덕션 환경에서 사용할 준비가되었습니다 물론, 이것은 훌륭한 GUI입니다

아직까지는 그런 것은 아니지만 몇 주 안에있을 것이라고 말했다 몇 개의 버튼을 클릭하고 배포합니다 너는 갈 수있어 그리고 나는 이것을 잊어 버렸다 우리에게 기회가 있다면, 우리는 돌아가서 그것을 볼 수 있습니다

그러나 우리는 모든 모델을 모니터링하고 로깅합니다 우리는 방금 배포했습니다 한 번 클릭하면 모든 것이 나타납니다 그래서 당신은 그것을보고 있습니다 당신은 당신의 대기 시간을보고 있고, 오, 기다려라

대기 시간이 너무 긴 이유는 무엇입니까? 그리고 나서 당신은 이렇게 말합니다 오 알 겠어 나는 코어가 충분하지 않았거나 그렇지 않았다 우리가 가진 스파이크를 다루기에 충분한 노드가 있어야합니다

당신은 약간의 비틀기를 만든다, 당신은 버튼을 클릭한다, 너는 벗어나고있어 그리고 이상적으로는 이상적으로 이것을 할 필요조차 없습니다 그러나 현실은 우리가 아직 거기에 있지 않다는 것입니다, 그래서 약간 조정해야합니다 하지만 당신도 직접 할 수 있습니다 그것이 쉬운 방법입니다

이것이 MLOps를 수행해야한다고 생각합니다 그럼 왜 구름? 이제 질문을해야 할 것 같습니다 얼마나 많은 사람들이 글쎄, 그냥 해보자 얼마나 많은 회사가 현재 사용하고 있습니까? 그들의 ML 중 하나에 대한 클라우드? 우리에게는 몇 가지가 있지만 많지는 않습니다 우리는 그것이 사실임을 알게됩니다 나는 너를 구름으로 팔지 않 았어 그것처럼 들리 겠지만, 사실이라면 사과드립니다

분명히 그것은 내가 살아있는 일을하는 것입니다 그러나 여기서 열린 대화를 나눕시다 구름이 반드시 모든 사람에게 필요한 것은 아닙니다 나는 몇몇 사람들과 오프라인으로 대화를 나눴다 그러나 여기서 그것이 빛나는 곳입니다

그리고 여러분이 이러한 요구에 부응한다면, 당신은 그것을 고려해야합니다 우리는 세계적인 수준의 네트워킹과 인프라를 갖추고 있습니다 Google 우리는 정말 그것에 자부심을 느낍니다 따라서 대기 시간을 줄이고 시작 시간을 단축 할 수 있습니다

자신 만의 솔루션을 선보이면서 얻을 수있는 것보다 탄력성과 확장 성 – 이는 유행어이기도합니다 그러나 그것에 대해 생각한다면, 구매하면 자신의 사무실에 놓을 컴퓨터 집단 또는 자신의 데이터 센터에 고정 된 비용이 있습니다 그리고 그 이상을 사용하면 정말 나쁜 대기 시간을 갖게 될 것입니다 당신은 충분한 수용력이 없기 때문에 봉사 할 때 당신이 그것보다 적게 사용하면, 당신은 유휴 상태에 있거나 앉아있는 서버에 돈을 낭비하거나, 힘을 사용하여

그리고 클라우드에서, 당신은 당신이 사용하는 것을 지불하고 있습니다 규모를 올리면 사용하는 대금을 지불하게됩니다 당신은 축소하고 어떤 것도 사용하지 않고 있습니다 너는 아무것도 지불하지 않는다 높은 가용성

Google은이 사실에 자부심을 가지고 있으며 그 중 일부는 다음 줄 (Google SRE)으로 인해 SRE는 현장 신뢰성 엔지니어를 의미합니다 너는이 소식을 들었을지도 모른다 Google은 최고의 엔지니어를 고용합니다 생산 시스템을 운영하고 유지 관리하는 방법을 알고 있습니다 그리고 그들은 시스템 설계를 도왔습니다

시작하는 정전이 거의 없다는 것을 정전이 발생하면 호출기가 꺼집니다 또한 응답하고 신속하게 완화하는 방법을 알고 있습니다 거기에있는 모든 문제 Google Cloud가 제공하는 이유 중 일부입니다 서비스 가용성 향상 이 분들 때문입니다

배포 속도 90 초 만에 모델에서 출발했습니다 내 노트북에서 한 생산 학년에서 봉사 그러면이 줄을 보게 될 것입니다 어쩌면 나는 이것을 지나치게 강조했지만, 나는 정말로 총 소유 비용과 무엇에 대한 비용을 지불해야한다고 생각하십니까? 당신은 클라우드의 진정한 이점을 사용합니다

그럼 아직 준비가 안 됐으면 어떡하지? 왜 여러 가지 이유가 있습니다 이러한 유스 케이스가 사용자 시나리오에 맞지 않을 수도 있습니다 아마 당신 회사는 클라우드 같은 것을 채택하는 데 정말로 느릴 것입니다 또는 다른 기술 어쩌면 너희들은 단지 온 보딩이긴하지만 너는 여전히 전이 시간이있다

나는 당신을 Kubeflow, 우리 팀이 만든 클라우드 AI 플랫폼 – 그리고 그것이 무엇인지 – 나는 이것을 ML의 아나콘다라고 부른다 ML을 가져 오는 패키지 묶음이므로 ML을 매우 쉽게 만들 수 있습니다 Kubernetes에 할 그래서 너희들이 이미 Kubernetes를 사용하거나 생각하고 있다면 Kubernetes에 관해서, 당신이 그것을 실행할 수있는 곳 Minikube가있는 노트북에서 어디서 실행할 수 있습니까? 사설 클라우드 또는 온 – 더 (on-prem) 서버 인 경우 온 프레미스입니다 클라우드에서 실행할 수 있습니다

Amazon은 방금 Kubernetes를 발표했습니다 Microsoft는 Kubernetes를 보유하고 있지만 분명히 Google의 Kubernetes 엔진을 사용하기를 원합니다 그리고 하이브리드 케이스가 있습니다 데이터 센터가 있고 용량이 있습니다 그러나 용량 이상이되면 구름에 넘칠 수 있습니다

그리고 물론, 클라우드 ML 엔진 나는 오늘 우리가 가지고있는 것에 어느 정도 초점을 맞추고있다 클라우드 ML 엔진을 관리 Kubeflow라고 생각하고 싶습니다 따라서이 물건을 직접 관리하고 싶지 않으면, 귀하는 관리 서비스에 대해 비용을 지불 할 수 있습니다 괜찮아 그래서 저는 예측에 많은 관심을 보였습니다

그러나 MLOps 물건은 단지 그 이상입니다 우리가 다이어그램에서 보았던 것처럼 이제 비 예상 사례에 대해 조금 이야기하고 싶습니다 그리고 내가 말할 수있는 것이 많다 티저로, Google에서 많이 기대할 수 있습니다 앞으로 몇 달 안에, 정말 멋진 것들을 많이, 그게 내가 말할 수있는 전부 야

그러나 언제 구름에서 훈련하고 싶습니까? 이것들은 명백해 보일지도 모르지만 두 번째로 그들에 대해 이야기합니다 클라우드에서는 실제로 대형 시스템 유형을 사용할 수 있습니다 얼마나 많은 사람들이 당신의 책상 밑에 96 개의 코어를 가지고 있습니까? 그렇게한다면, 나는 당신의 기계를 원해 나는 우리가 모자를 씌우는 것을 기억하지 못한다 그러나 나는 그것이 테라 바이트의 RAM과 같다고 생각한다

우리는 그만큼의 기억을 가진 기계를 가지고 있습니다 그리고 내가 뭘 발견했는지 알아? 나는 실제로 지난 여름 인턴을했습니다 나는 말했다, 헤이 Criteo 데이터 세트를 가져옵니다 필요한만큼 RAM을 확보하십시오

필요한만큼의 RAM을 갖춘 VM을 확보하십시오 그것을 훈련시키고 무슨 일이 일어나는 지보십시오 훈련하는 데 3 시간이 걸렸습니다 당신은 많은 RAM, 수백 기가 바이트가 필요하다고 생각합니다 훈련하는 데 3 시간 씩 걸렸습니다

그는 분산 된 훈련을하는 방법을 알아낼 필요가 없었습니다 그는 단지 서버 한 대당 3 시간을 지불해야했습니다 그 많은 RAM을 가진 합리적인 가격, 그가 끝나면 그것을 닫고, 그는 정말 훌륭한 모델을 가졌습니다 모든 데이터에 대해 교육을 받았습니다 코어 수

하이퍼 파라미터 스윕, 그리드를 수행하고 있다고 가정 해보십시오 검색, 또는 그와 비슷한 것을 평행하게하고 싶지만, 당신은 SPARC 클러스터를 설정하고 싶지는 않지만, 아니면 그 중 하나를 유지하고 싶지 않습니다 96 코어로 기계를 구입하십시오 96 번을 달릴 수 있습니다 음, 각 작업이 실행중인 코어 수에 따라 다릅니다

그러나 당신은 96 코어와 함께 많은 것을 할 수 있습니다 물론, 당신은 VM을 얻고 싶지 않습니다 네가하기 때문에 모든 일을해라 전체 시간 동안 그것을 지불 비싸다

그러나 이것은 구름이 당신에게 가져 오는 것입니다 나는 분산 된 훈련에 대해서 이야기했다 그것은 사소한 일입니다 아무도 XGBoost를 설정하지 않으면 SPARC에 대한 병렬 교육을 수행하면됩니다 온라인으로 시도해 볼 수있는 몇 가지 샘플 코드가 있습니다

하지만 실제로 사소한 일입니다 그리고 우리는 아직 XGBoost 분산 교육을 지원하지 않습니다 TensorFlow의 경우 매우 간단합니다 분산 된 훈련을 할 수 있습니다 tf

estimator를 사용하는 경우 문자 그대로 변경할 코드가 없습니다 당신은 클라우드에 그것을 제출하고 확장합니다 규모에 맞게 서버에 말하십시오 그리고 언젠가 우리는 뭔가를 가져올 수 있기를 바랍니다 XGBoost에 그렇게 좋아

우리는 하이퍼 파라미터 서비스를 가지고 있습니다 XGBoost에서 사용 가능한 HyperTune이라고 불리는 그리고 scikit-learn 모델 그리고 훨씬 더 나은 결과를 제공합니다 그리드 검색이나 무작위 검색보다 최첨단 알고리즘, 거기에서 동급 최강의 성능을 얻을 수 있습니다 그리고 그것은 모두 평행합니다

기다릴 필요가 없습니다 그래서 나는 여기에있는 연구원과 이야기를 나눴다 그는 그가하는 일이 주위에서 활약하고 있다고 말합니다 작은 데이터 세트에서 하루 동안, 그가 좋아하는 것을 얻고 밤에 직장을 보냅니다 아침에 돌아와 수표 그의 모델이 얼마나 잘했는지

그의 손가락을 횡단하여 오류가없는 상태로 유지합니다 통과 했지? 아무도 그것과 관련 될 수 있습니까? 나는 그것이 내가 박사 과정에서했던 것임을 압니다 반복성 그래서 제가이 말을하는 것은 더 많은 예제가 있지만 이것의 가장 좋은 예가 있습니다 지속적인 교육이 필요합니다 이제는 클릭률 (CTR) 교육에 대해 당신이 새로운 로그를 얻는 모델과 그것들의 톤, 매일 매일 매일 매일 다른 모델을 훈련하게됩니다

그래서 같은 코드를 사용할 것입니다 당신은 매일 그것을 사용하려고합니다 또는 실제로 많은 사람들이 1 시간마다 같이 훈련합니다 그래서 그들은 매우 자주 훈련하고 있습니다 주피터 노트북에 가고 싶지 않을거야

매일 오후 4시에 버튼을 누르십시오 다른 모델을 훈련 이것은 반복되는 프로세스입니다 생산 될 필요가있다 그것은 견고해야합니다

그래서 구름이 정말 좋습니다 사실, 만약 당신이 이점을 취하고 있다면 그 큰 기계들과 그 큰 코어들 중에서, 그것은 일자리를 보냅니다 그것은 짧은 시간 동안 모든 것들을 사용합니다 그것은 그것을 끈다 그리고 당신은 그 시간 동안 단지 지불한다

네가하고 있다고 그럼 여기로 돌아와서 구름처럼 보일지도 모른다 그래서 당신이 지불 할 때 지불 할 가격이 있습니다 로컬 컴퓨터에서 클라우드로 전환합니다 코드를 어떤 방식 으로든 패키지해야합니다

서비스가 이해할 수있는 것 그리고 여러 가지 방법이 있습니다 우리는 컨테이너를 지원할 것입니다 그것을하기위한 업계 표준 방법이되고 있습니다 지금은 파이썬 패키지를 사용합니다

따라서 python setuppy sdist를 실행하면됩니다 두 번째 명령을보고 업로드합니다 구름에있는 물통에 그리고 그것이 끝났다고 생각합니다

그런 다음 Enter 키를 누릅니다 그리고 내가 여기서하고있는 모든 것이 바로 여기서 볼 수 있습니다 클릭률 (CTR)에 대한 CTR이라는 교육 직업을 제출하십시오 타임 스탬프가 붙어있어 고유합니다 나는 그것이 트레이너라고 말하고 있습니다

이 패키지는 우리가 방금 업로드 한 것입니다 런타임 버전은 다음과 같은 버전을 알려줍니다 지금 나는 이것이 더 명백했다는 것을 바란다 scikit-like이었다 무엇이든 버전, 그러나 이것은 scikit-learn 버전으로 번역됩니다 이것은 Cloud ML Engine의 런타임 버전 1

8입니다 우리는 미국 중앙에서 그것을 할 것입니다 이 프로젝트와 몇 가지 명령 줄 매개 변수가 있습니다 그래서 나는 이것을 말하는 걸 잊어 버렸습니다 이 train

py는 우리가 처음에 본 정확한 코드입니다 유일한 것은 당신이 아마 벗을 것입니다 내가 가진 최대 샘플 라인, 내 Pixelbook에서 처리하지 못했기 때문에, 그리고 내가 알아내는 데 얼마나 걸렸는 지 인정하지 않을거야 그게 내 수첩에 충돌 한거야 왜냐하면 그것은 내게 말하지 않았기 때문입니다

그리고 당신도 알다시피, 당신은 최대 깊이를 변경할 수 있습니다, 또는 추정 자의 수를 당신은 생산에 들어갔을 것입니다 이것은 실제 생산 코드입니다 그래서 몇 가지 개조하면됩니다 당신은 그것을 구름으로 보냅니다 작업이 대기열에 있음을 알 수 있습니다

다시 한번, 우리는 일급 통합이 없다 그래서 우리는 여기서 일자리 목록으로 가야합니다 그리고 보자 그거 너는 회전하는 것을 본다 아직 기계를 돌리는 중임을 의미합니다 예측 서비스가 실제로 돌아갑니다 기계는 아주 빨리

훈련은 조금 더 오래 걸립니다 나는 그것이 단일 기계 일이라고 생각한다 보통 1 ~ 2 분 정도 걸립니다 그래서 우리는이 직업에 갈 수 있습니다, 로그를 한번보세요 슈퍼 재미있는 아무것도, 단지 당신을 보여줄 수 있습니다

여기에 로그와의 통합이있다 운이 좋으면 나올 수있어 그래서 여러분은 모든 결과가 당신이 돌아갈 필요가있을 때를 대비해서 틀린 것을 찾아 내라 또는 옳은 것 그리고 그 작업이 성공적으로 완료되었음을 알 수 있습니다

그래서 당신이 한 가지 일을 보냅니다 하지만 내가 말하는 유스 케이스 정말로 이것을 생산하고 그것을하는 것에 관한 것입니다 매일 우연히 기상 이변에 익숙한 사람이 몇이나됩니까? 너 몇 명있어? 아마도 데이터 엔지니어라고 생각합니다 나는 누군가에게 우리가 말하기 전에 언급했다

나는 여기서 약간의 파이프 라인에 대해 암시를하기 시작했다 따라서 Airflow는 무엇입니까? 그리고 많은 오케스트레이션 시스템이 있습니다 그러나 그것은 당신이 함께 사슬로 묶을 수있게 해줍니다 당신이 반복적으로 할 수있는 프로세스 이 경우 매일 매일

바로 여기에서 볼 수 있습니다 그리고 이것이 실제로 의미하는 바에 들어가겠습니다 하지만 당신은 지난 2 일 동안 매일 그것을 볼 수 있습니다 주, 우리가 방금 서비스에 제출 한이 코드 모델을 훈련시키기 위해 달리는 것은 이전 7 일에 달렸다 며칠간의 데이터 가치, 모델 제작, 그 모델을 게재에 푸시했습니다

이제 그래프보기에서 볼 수 있습니다 아주 단순한 DAG 나는이 데모를 위해서 그렇게했다 그것은 단지 훈련을하고 버전을 만들지 만, 여러분 중 몇몇은 이미 명백한 문제를 지적했다 훈련 중 문제가 발생하면 나는 그것을 생산에 밀어 붙였습니다

나는 상처의 세계에 빠졌을 것입니다 심지어 해고 당할 수도 있습니다 그래서 평소에 무엇을 할 것인가? 그건 어렵다 평가를 실행하는 그래프에 다른 모드를 넣을 수 있습니다 그래프의 다른 노드는 해당 모델의 품질을 검사합니다

이전 모델보다 우수하거나 현재 모델입니다 당신이 그것을 밀기 전에 서빙하고 나서 계속하십시오 그것을 서빙으로 밀어 넣으십시오 그러나 간단하게하기 위해, 나는 방금 훈련하고 밀었습니다 그리고 당신은 그것을 볼 수 있습니다 – 그 코드는 실제로 매우 합리적입니다 다시 말하지만, 당신은 사전을 가지고 있습니다

어떤 바이너리를 사용합니까? 등등 이러한 DAG 인수는 Airflow가 작동하는 데 필요합니다 약간의 오버 헤드 복사하여 붙여 넣기는 내가 생각하기에 좋아하는 것입니다 그리고 여기 DAG와 함께 당신이 말하는 곳이 있습니다 – 다른 말로하면, 내가 정의하려고하는 내 파이프 라인으로 당신은 외모가이 훈련을 가지고 gcloud 연산과 매우 비슷하지만 파이썬 코드에서 가능합니다

안녕하세요,이 바이너리를 교육용으로 사용하십시오 그리고 나서 당신은 버전을 만든다 다시 gcloud 옵션과 같이 보입니다 버전 그래서 나는 얼마나 많은 코드 라인이 있는지를 알지 못한다

하지만 이것의 핵심은 무엇입니까? 아마 20 줄의 코드일까요? 그리고 우리는이 파이프 라인을 우리가 정의한 바 있습니다 푸시하는 매일 매일 클라우드에서 실행할 수 있습니다 생산 모델 내가 이걸 가지고 있는지 보자 그러면 ctrdaily 모델을 볼 수 있습니다

내가 말했던 모델 기억은 모델이 버전 용 컨테이너와 같은 것인가? 그리고 그 모델의 모든 버전이 있습니다 매일 푸시됐다 이제 프로덕션 시스템에서도 아마 쓰레기를 모으고있을거야 그래서 당신은 너무 많은 것을 놓고 다니지 않아도됩니다 이것이 기본 설정임을 알 수 있습니다

그래서이 모델에 트래픽을 보내면, 그것은 실제로 그 버전으로 갈 것입니다 당신은 그것을 매일 갱신하기를 원할 것입니다 적어도 당신이 그것을 확인한 후에 그래 질문 있니? 나는 이것을 말하는 것을 잊었다

우리가 가진 모든 방해로 어려웠습니다 내가 선호하는 것은 인라인으로 질문을하는 것이 었습니다 하지만 지금은 거의 끝이났습니다 그러나 이러한 파이프 라인이나 교육에 대한 질문이 있으십니까? 네 관객 : 당신이 보여준 로깅 – 그래

헤이즐러 : 네 관객 : 그것은 구름에서 침을 뱉어내는 것입니까? 상자 자체, 아니면 내 코드에 로그인했다면 내가 침을 뱉을 수 있습니까? 네, 예고편 네 그래서 당신이 당신의 print 문을 쓰면 – 당신의 logginginfo 명령문, 파이썬 프로그래머라면 – 그 것들이 여기에 나타납니다

그리고 그것이 어떤 것이지 알려줍니다 불행히도 표준 오류가 나타납니다 오렌지 경고 징후로 걱정할 것은 없습니다 그것이 XGBoost 일 뿐이라고 말하고 있습니다

다른 질문? 그래서 이것은 정말로 나의 말의 끝입니다 단지 몇 가지 점을 요약하면, 생산이 어렵다 구름이 쉽습니다 그리고 클라우드에서 사용하는 것에 대해 비용을 지불해야합니다 괜찮아

그리고 약간의 티저는 우리가 다른 질문이 있는지 확인하십시오 이야기 전체에 대해 그러나 우리 팀은 더 많은 관심을 기울이고 있습니다 MLOps 감소에 그래서 우리는 아마도 그 페이지에서 10 박스를 보았을 것입니다

나는 그들 중 몇 명을 연설했다 케이스와 서빙 케이스 실제로 거기에 더 많은 상자가 있습니다 너는 우리가 시간이 갈수록 쉽고 쉬워집니다 비용 효율성 향상

그것은 우리에게 지속적인 초점입니다 인프라 비용을 상환 할 수있다 모두에게 따라서 우리는 실제로 당신에게 더 낮은 비용을 줄 수 있습니다 너 혼자하는 것보다

그리고 우리는 또한 자신과 심지어 데이터 엔지니어와 같은 데이터 과학자, 재사용 가능한 작업을 다른 사람들과 공유 할 수 있습니다 우리는 그렇게 할 수있는 방법을 찾고 있습니다 [음악 재생]