TV Novel : Eunhui | TV소설: 은희 EP.129 [SUB : ENG,CHN / 2014.01.02]

1 백 29 회 로라 킹은 단 하나의 어머니 다 내부 고발자 없음 누군가가 기여하고있는 것 같습니다

그것은 그렇게되어야합니다 차의 대통령은 바보가 아닙니다 그는 일어 서지 않을 것이다 차의 대통령은 오랫동안 알고 있었던 것 같습니다 Enji는 대통령의 딸입니다

Enji는 대통령의 딸입니다 왜 뉴스 대행사 한테 말 했니? 확실히 호텔의 이미지를 파괴하려고합니다 대처할 수 없게 해줘 즉, 이미보고 된 바 있습니다 탈 수 없습니다

차 회장님이 정말로 나를 미치게합니다 내가 앞으로 무엇을 할 것인지 기다리고 있습니다 당신이 판단 할 수없는 것 같습니다 차 회장이 아닐 수도있다 저 Che Yingzhu 또는 Lin Chengzai입니까? 자동차 회장 만 그것은 차 회장이해야합니다

증거가없고 필요도 없습니다 너 먼저 진정해 미리 상황을 처리해야합니다 그것은 한국의 통신사입니다 대통령 선거를 도와주세요

서울 호텔 쿠이 밍호 안녕하세요, 서울 호텔이 여기에 있습니다 어떤 기자가 호텔에 왔습니까? 그러면 더 이상의보고가 없을 것이라고 나는 믿는다 잘 했어 큰 것은 좋지 않다, 부통령 무슨 일이야? 이제 1 층 로비에는 많은 기자들이 있습니다 무엇을 해야할까요? 무엇을 해야할까요? 하나는 그것을 들여 보낼 수 없다

좋은 부회장 기자가 오면 일이 커지지 않는가? 기자가 다가 왔다는 것은 물론 문제입니다 더 이상하지 않기 위해 그럼 내가 보자 진 엔지는 실제로 딸입니다 더 충격받은 것은 대통령의 남동생입니다 실제로 죽은 사람들 신문에서 더 이상이를보고 할 수 없습니다

예 Jin Enji는 오랫동안 보지 못했다 너 여기서 뭐하고 있니? 집에 얼마나 좋은가요? 나는 또한 걱정된다 나는 또한 지금 소식에 대해서도 들었다 그것은 삼촌이하지 않을 것입니다 아니, 맞지? 자동차 회장 만 거의 모든 뉴스 제공 기관에 거의 동시에 제출 이미 확인 됨 다른 경쟁 호텔이 될 수도 있음 아니요 나는 또한 거기 밖으로 발견했다, 그것은 그것이 아닌 것처럼 보인다

저기있는 사람들은 너무 자세히 알 수 없습니다 집에 가라 정서적이 될 ​​수 없다 나는 그것을 스스로 확인해야한다 진 엔지 Enji와 얘기 했니? 나는 그녀가 그것을 알고 있다고 말하지 않는다

그런 다음 그녀는 인천으로 갔습니까? 그녀를 막아야 만합니까? 나는 엔지를 데려 갈거야 그냥 놔둬 멈출 예정인 파티 인 Enji 있을 법하지는 않지만 하지만 그녀는 다 환기구 다 내 마음 속에 기분이 나아질지도 모른다 내가 준비한 것 기꺼이 받아들이십시오

이게 뭐야? 조금 성의 약간의 작은 것들이 당신을 걱정하게합니다 왜 이러는거야? 그 여인의 몫도 준비되어 있습니다 만족스럽지 않으면 나는 다른 것을 준비하려고합니다 그럴 필요 없어 네가주는 이후 나는 그것을 받아 들일 것이다

고마워 너무 정중하다 또한 회원이 기꺼이 새 감독과 식사를하고 싶습니다 좋은 어쨌든, 공식적으로 인사해야합니다 오른쪽 서울 호텔 골든 지사 신문 뉴스 그 소식은 사실입니까? 명확하지 않음 나는 또한 신문 뉴스를 배웠다

또한 관계가 얼마나 가깝습니다 이런 종류의 일도 말하기 어렵습니다 하지만 그런 종류의 뉴스 때문에 호텔 운영은 타격을 받아야합니다 그건 안돼 너에게는 불법적 인 딸도있다

어째서? 잠깐 김동남의 남동생 너 친구 야? 예 이미 과거의 일이다 사실 관계가 좋지 않습니다 그렇지? 선거 중 스캔들이 있다는 사실에 특별한주의를 기울여야합니다 좋은 평의원 뭐라구? 서울 호텔의 대통령은 불법 딸이 있습니까? 누구 시죠? 뭐라구? 나는 알고있다

빅 브라 더 푸 비서 말하는 법 무슨 사생아? 안녕하세요, 신문을 사러 서둘러주세요 왜 갑자기 신문을 사나요? 구입하고 사고합시다 좋은 형 봐 불법 딸은 진 엔지 진 총장이 나를 때 리거나하는 것은 당연한 일입니다 그것은 죽을 축복입니다 정말로 차 회장 그것에 대해 들으셨습니까? 이제 서울 호텔은 엉망입니다

방금 셴 씨를 만났습니다 나는 그것에 대해 들었다 당신은 놀랄 것 같지 않습니다 Nji가 Kim 대통령의 딸이라고 들었습니다 매우 놀랐다

창녀 나 딸이 사랑하는 사람이든간에 무엇이 바뀔 수 있습니까? 선거 사무소 창립 식 어떻게 준비 되었습니까? 물론 나는 이미 준비가되어있다 지역 지도자들이 모이는 한 바로 시작할 수 있습니다 많은 중요한 사람들이 참석할 것입니다 잘못된 일을 잘하는 것 당신은 차의 대통령이 안심할 수 있습니다

어떻게 다시 여기에 오니? 왜 이러는거야? 그게 무슨 뜻 이죠? 이모는 살인자의 누이 야 호텔을 점거하려고 여자 유혹 그뿐만 아니라 그녀에게는 불법적 인 딸이있다 너 정말 몰라? 그거 나는 너에게 묻고있다 그런 소식이있는 이유는 무엇입니까? 너 나 한테 묻는거야? 나는 정말로 모른다

그녀는 저에게서 그런 종류의 것을 은폐했습니다 그러나 그것은 나를 매우 길게했다 정말 미안해 나는 내가 일찍 당신에게 말해야한다 그 말하고 싶니? 내가 뭘 할 수 있니? 이제 삼촌의 호흡조차도 그것을 믿을 수 없습니다

당신은 사람들에 대해서 생각할 수 없습니다 샤오 후 (Shao Hu)는 너무 얽혀서 즉시 돌아 간다 나는 항상 너를 믿어왔다 이모는 또한 삼촌을 남동생으로 대우합니다 우리 엄마가 뭔지 알아? 그녀는 아무것도 몰라

이제 삼촌을 후원자로 대하십시오 어떻게 할 수 있니? 우리는 어떻게이 일을 우리에게 할 수 있습니까? 맞아 너의 아버지의 유일한 친구 야 내 동생은 내 동생과 다르지 않습니다 어떻게 그런 일을 할 수 있니? 어떻게 그런 일을 할 수 있니? 삼촌은 일화예요

아직도 내 아버지를 모함했다 이것 외에 무엇이 필요한가요? 삼촌은 신문에 그런 소식을 전했다 그것은 한 조각의 케이크입니다 너 왜 다시오고있어? 내가 얽혀있는 것을 자극하고 싶다 탈출의 증거를 얻는 것이 어렵습니까? 뭐하고 있니? 내가 뭘 할 수 있니? 너의 아버지는 여전히 호텔에 질려있어

호텔 이미지의 영향 로라 킹이 미혼모를 은폐했다 이게 또 뭐야? 호텔 회장은 미혼모인가요? 불법적 인 여자가 원래의 엔지 여동생입니까? 그래서 호텔의 사장님이 당신 어머니세요 예, 그녀는 제 어머니입니다 너 왜 그렇게 화나니? 뉴스 내용에는 아무런 문제가 없습니다 뭐라구? 원래 호텔의 사장은 네 엄마 야

너의 아버지 지금 소리 지리지 마 간단히 말해 호텔의 남동생 사람을 죽이는 것도 사실입니다 적어도 당신은 지금 살인자의 딸이 아닙니다 적어도 당신은 지금 살인자의 딸이 아닙니다 하지만 미혼모의 딸? 이건 사생아인가요? 자동차 Yingzhu 말하지 마세요

호텔의 딸은 어때? 무엇이 바뀔까? 그러니 우리 아빠 한테 가서 그걸 쫓아 가려고? 그게 내 아버지와 무슨 상관이 있니? 마지막으로, 여동생은 여전히 ​​살인자의 딸입니다 나는 오랫동안 엄마에게 전화를 해 온 사람을 항상 대면 할 수는 없습니다 나는 수프 식당 이모로 입을 갈아 입었습니다 Che Yingzhu에 대해 다시 말하지 마십시오 더 이상 말하지 마라

24 년 동안 당신의 얼굴을 키웠습니까? 수프 식당의 숙모는 살인자의 아내입니다 누이는 살인자의 딸이다 네가 행복하지 않다면 당신은 수프 식당을 버리고 떠날 것입니다 내가 뭘 할 수 있니? 결국 수프 레스토랑의 숙모 만 봐 내 여동생은 여전히 ​​수프 식당의 딸이다 살인자의 딸인가? 너 왜 나를 다시 때리고 싶니? 너는 명중했다 당신이 살인자의 딸이라는 것을 증명할 것입니다

당신이 살인자의 딸이라는 것을 증명할 것입니다 엔 지 왜 날 때리는거야? 왜 언니가 나를 때렸나요? 내가 뭘 잘못 했니? 너는 내 무고한 아버지에게 소리 지른다 나는 무관심 할 수 있는가? 나는 그 말을 나 앞에서 감히 말한다 너를 용서할 수 없어 형제 엔 지 무슨 일이야? 사고 였어

무슨 일이 있었는지 말해봐 당신이 무엇을 바꿀 수 있는지 말해 주면 아직도 삼촌을 포기할 수 없다 나는 이해하려고 노력했다 고민은 미쳐 가고있다

너를 이해하고 싶다 할머니 한테 말하면 즉시 달리고 싶다 우리 아버지가 살인자가 아니라고 말해줘 그러나 나는 그것을 할 수 없다 네가 너무 가난하다고 느낀다

네가 나보다 열심히 일하기가 두렵다 그래서 그것에 대해 이야기 해 봅시다 너는 그것을 알기 위해 말해야 해 아빠 한테 뭐라고 했니? Yingzhu와 왜 싸우는가? 나는 삼촌을 용서할 수 없다 삼촌을 용서하는 절대 방법이 없어

엔지 누이가 정말 미치겠 니? 어떻게 내가 아빠를 의심 할 수 있니? 엔지가 나를 오해 한 것 같다 오해가 있더라도 지난 번에 그녀가 도망 간 것에 대해 이야기했다 이번에는 항상 말도 안되는 말 통신사에 대한 기여는 무엇입니까? 정말 무리한 나는 이미 그녀에게 분명히 말했다 그것에 대해 말하지 마라 아빠는 항상 몇 번이고 그녀는 점점 더 많이 될 것입니다

Enji 누나 부통령이 다시 찾으면 원고를 뉴스 대행사에 제출했다고 말하면됩니다 잉 저우 나는 내 아버지가 잘못하도록 내버려 둘 수 없다 Nji 선생님은 호텔의 사장입니다 우리뿐만 아니라 왜 아빠 만 탓할거야? 그게 뭐야? 뭐라구? Enji는 호텔 사장입니다 그것은 정확히 무엇을 의미합니까? 내 동생이 잘못한게 아니야

형제 체 잉 저우 당신은 이미 신문 뉴스를 알고 있습니다 모르겠다 나는 또한 신문을 배웠다 한 가지 물어보기 뭐라구? 아빠 한테 무슨 일이 있었는지 아십니까? 아빠 한테 무슨 일이 있었던거야? 아무것도, 나가 정말로 몰라? 이십사 년 전의 것들 그리고 호텔의 사장 정말로 아무것도 몰라? 엄마 이모는 어떻게해야합니까? 최근에 집에 어떻게 있었습니까? 갑자기 엄마가 만든 국밥을 먹고 싶다

나는 알고있다 나는 너에게 약간의 시간을 줄 것이다 나는 어머니가 평생 반 동안 고통을 느끼게하고 싶다 미래의 행복한 하루 되세요 나는 삼촌이 너무 싫다

먹기 좋은 곳 순덕, 오늘 신문 보셨니? 어떻게 찾을 수 있습니까? 찾을 수 없으며 어디를 가야할지 모르겠습니다 오늘 가게 입구에 신문이 있습니까? 방금 불에 가져 갔어 너 무슨 소리 야? 나는 아직도 한 마디도 보지 못한다 어떻게 불을? 수 있습니까? 너 나를 정말로 미치게하려는거야 사업을하기에는 너무 지저분합니다

왜 일찍 돌아 오는거야? 오늘 약이 끝났습니까? 보호 비용을 징수 할 사람을 두려워합니까? 자신감을 가지고 사업을 할 수 있습니다 선거 때문에가 아니라 배너는 선거 운동가에게 전화하는 것을 말한다 너무 시끄 럽거나 사고 팔 수 없다 나는 보궐 선거를해야한다는 것을 기억했다 들었어

인천 두부 차장 그 사람이 관련되어있는 것 같습니다 그는 우리 가게에 배달하지 않습니다 공장 매니저의 가족? 차 대통령? 아빠, 우리를 선택해야합니까? 말도 안되는 말 하지마 나는 정확한 상황을 모른다 내가 언제 기다릴 지 알게 될거야

나중에, 그것은 올 것이다 커피를 무료로 마시지 못하게하십시오 실제로는 보호 수수료가 부과됩니다 입으로 여기 올 시간이 없을 수도 있습니다 그가 선거 운동에 전화했기 때문에 그를 보았습니다

바쁜 그렇지? 선거 시즌까지 돈을 벌 수 있어야합니다 나는 손님들을 장님에게 데려왔다 공장 매니저는 술 한 잔달라고했다 아니면 우리 삼촌이 최고야 예 이 아이는 정말로 나는 그 아이를 안다는 것을 안다

이 하원 의원은 누구입니까? 누가이 시간을주고 싶어하든, 비누 또는 고무 신발을 보내지 마십시오 예 나는 며칠 안에 쌀 와인을 무료로 마실 수 있습니다 그레이트 가난한 민간인 이것은 기밀 사항이다 나는 너에게 특히 말하고있다 이리 오렴 이해하니? 그러니 다른 사람 따기를 생각하지 마라

내 말 뜻을 이해하고, 세 가지가되게해라 나는 조교 모자 야 길잡이 차 대통령은 어떻게 된거 야? 큰 움직임 없음 그것은 분명히 그렇게 될 것입니다 석고 가루가 방금 경찰서에서 풀려 났기 때문에 밀수입에 특별한 것은 없습니다

경우에 따라 계속 모니터링하십시오 직접 가지 마라 누군가 보내기 확인 가장 중요한 것은 자동차의 대통령이 공식적으로 의회 의원 선출에 들어갔다 선거 사무소 설립식이 즉시 개최 될 것으로 보인다 그것은 그렇게되어야합니다

그는 그 길 밖에 없습니다 자동차의 대통령이 국회의원이되면 우리는 또한 매우 두통이 될 것입니다 차의 대통령은 쉽게 포기하지 않을 것이다 의회 의원으로서 그는 인천에 많은 돈을 투자했다 돈? 누가 더 많은지 보자

박씨를 먼저 만나러 가자 곧 출시 예정 갑자기 나를 찾고 있니? 신문에 실린 내용 때문입니까? 영동 개발의 문제점은 무엇입니까? 축복을위한 것이 아닙니다 모든 것이 잘되고있다 나는 신문을 읽는 것에 놀랐다 Jin Enji는 진 진 원장의 딸이다

사실입니까? 예, 그게 전부입니다 진 총장은이 세월을 매우 힘들어해야합니다 말해봐, 뭘 찾고있어? 나는 너를 오랫동안 보지 못했다 나는 너를 저녁 식사에 초대하고 싶다 신문 뉴스가 너무 바빠서

저녁을 먹는 것은 불가능합니다 할 말있어? 공화당 내부로 나에게 줄 수있어 위치가 있습니까? 어떻게 정치에 참여하고 싶습니까? 엔지 아줌마가 아직 돌아 오지 않았 니? 그녀는 그녀가 호텔에 갈 것이라고 말했다 아직도 돌아 오지 않는다 일을 원활하게하기 위해 인천에 가나? 예 차 대통령은 뭐래? 그가 그렇게했다고 인정합니까? 하얀 실행보세요

그러나 내 마음은 너무 편안합니다 즉 좋은 추위에 가라 부통령 나는 정말로 용서할 수 없다 무슨 일이야? 차 대통령이 너 한테 나쁜 짓을 했니? 그것없이 삼촌은 어떻게 우리를 위해 이런 종류의 일을 할 수 있습니까? 이모를 만드는 것으로는 충분하지 않습니다 우리는 어떻게 우리에게있을 수 있습니까? 더 생각하면할수록 더 화가납니다

그러나 더욱 슬픈 것은 모든 것을 복구 할 수 없습니다 아이 아빠 의원 선거에 정말로 참여할 계획입니까? 미안 엄마 정말 SHEN 씨의 제안을 거부 할 수 없습니다 그것이 좋은 것이라하더라도 그것을 기꺼이하지 마십시오 왜 그런 종류의 일을해야합니까? 꺼려하지 않는 사실, 나는 또한 시도하고 싶다 나는 의회의 구성원이 될 자격이 없다

나는 그런 뜻이 아니야 이모도 사실입니다 우리에게 의회 의원이 있다면 좋은 일 이니, 왜 항상 차단하고 있습니까? 이모 이런 종류의 일은 막혀서는 안됩니다 가족은 옳기 위해 함께 일해야합니다 – 그래, 남편 – 물론 모두가 동의하는 것 같다

이모도 허용됩니다 나를 반대하지 마라 무슨 일 이니? 차 회장이 말하지 않았어 국회의원이 아닌 이유 그 이유는 무엇일까요? 형제가 걱정할 수도 있습니다 미안, 내가 먼저 일어나고있어

형제 형제 쳉 자이 – 나는 볼거야 – 좋아 정말로 Cheng Zai 차 회장에게 무슨 일이 일어 났습니까? 나는 Ying Zhu가 말한 것과 같은 공장에 대해 신경 쓰지 않는다는 말을 들었다 이것은 그가 걱정하게했다 그를 내버려둬 형제 어떻게 이렇게 나올 수 있니? 공장의 주요 행사 다루기 가족은 먹기 위해 나와서 매우 행복하다

할머니는 걱정할 것입니다 엔기 때문에 온거야? 신문 뉴스를 잊어 버렸습니다 趁이 기회에 엄마도 언니 누도 찾아 냈다 좋은 일이야 좋은 무엇입니까? 너는 니긴이 지금 무엇이라고 생각하니? 당신은 호텔의 사장이 그렇게 말하고 있다는 것을 알고 있습니다

당신은 호텔의 사장이 그렇게 말하고 있다는 것을 알고 있습니다 그게 우리의 책임입니까? 게다가, 그녀는 호텔 대통령이나 창녀의 딸인가요? 우리와의 관계는 무엇입니까? 우리 모두가 친구라고 가정 해 봅시다 아무것도 변경되지 않습니다 Enji는 태초부터 가족이 아닙니다 나에게 중요하지 않습니다

더 생각하면할수록 더 화가납니다 그러나 더욱 슬픈 것은 모든 것을 복구 할 수 없습니다 나는 아주 분명하다 걱정되는 엄마는 무엇입니까? 나는 공장에 고통을주지 않을 것이다 걱정하게 만드는 것들을 만드십시오

내가 한번 할 수 없다고 생각하니? 어머니 선거 자금 모금 방법 뭐라구? 많은 사람들을 지원합니다 너무 걱정하지 마라 그것을 잡아라 이것은 참여를 주장한다면 나는 그것을 막을 수 없다 내가 도울 수 있는지 모르겠다

선거 자금 용으로 사용됩니다 이것을 사용할 필요가 없다 어쨌든,이 통장 공장이 막 시작했을 때 그것을 위해 당신을 위해 그것을 저장하기 위해 안심하고 사용하실 수 있습니다 어머니 하지만 나 한테 약속해야 해 선거가 끝날 때까지 상황이 어떻든간에 다른 사람들과 절대로 빚어서는 안된다

나 한테 약속 해 줄 수있어? 좋아, 약속 해 왜 아직도 나오지 않는거야? 죽기를 정말 좋아합니다 아니면 그냥 들어가서 문장을 설득합니까? 여전히 내 방식에서 벗어나야합니다 다시 기다려 곧 나올거야

차 사장은 어때? 이모가 뭐라고 했어? 공식 합의 정말? 나는 그것이 이렇게 될 것이라는 것을 안다 형님 께 축하드립니다 자동차 회장 축하드립니다 앞으로이 서클에서 도와 드리겠습니다 고마워요

아내 내 소송에서 가장 잘 생긴 것 몇 명을 선택하여 세탁하십시오 갑자기 왜 갑옷을 빨고 있니? 나는 미래의 MPs를 지원할 것입니다 물론, 잘 복장을하십시오 사람들이 나를 알아볼거야 이것을 말하는 것이 합리적입니다

양복을 주문 하는게 어때? 그 무료 현금은 무엇입니까? 그 아이는 곧 태어날 예정입니다 주를 구할 수 있습니다 너 무슨 걱정이야? 빅 브라더가 의회에 선출되는 한 너는 그렇게 열심히 고통 받고 있니? 뭐라구? 같은 말 주문 하시겠습니까? 남편은 그런데 나에게 일련의 것들을 줘? 보조 부인은 항상 이렇게 입을 수는 없습니다 그것을 원하니? 같이 해보자 해, 해

나는 너무 행복해 너 교회에 안가? 할머니 할아버지 그녀가 동의했다 선거에 참여해야합니까? 지금 그만 둘 수 없어 이것은 공장과 가족에게 좋습니다 더 이상 교회에 가지 마십시오

내 옆에서 도와 줘 나는 앞으로 어떤 일이 일어날 지 모른다 왜 당신의 얼굴을 보여주고 싶습니까? 왜 당신의 얼굴을 보여주고 싶습니까? 무슨 일이 일어날까요? 제발 지금 포기 해주세요 창업 기념식이 매우 바빴 기 때문에 나는 먼저 나갔다 시간이있을 때 사무실에 오시겠습니까? 박씨와 원만한가요? 박씨와 원만한가요? 인천에 가서 알고 싶은지 모르겠다

함께 가고 싶니? 아니요 왜 그 차의 회장 때문에요? 나는 갔다 1 호 자동차 깡통 9 호 선거 사무소 창립 기념 행사 환영합니다 입력하십시오 차 회장이 너를 축하해 웰컴 파크 회장 시간을내어 주셔서 감사합니다

모두는 차의 대통령이 선출 될 수 있다고 생각하는 것 같습니다 이미 모든 곳에있다 사실, 선거 결과는 같습니다 사실, 선거 결과는 같습니다 상을 받았다

들어 오세요 자동차 회장 축하드립니다 부통령은 어떻게 여기에 올 수 있습니까? 내가 오지 않으면 누가 올 것인가? 양심적 인 기업가 자동차 대통령에게 아주 적합합니다 나는 성씨를 말했다 너 왜 여기 있니? 그것은 Cui라고 불리는가? 성이되기가 어렵습니까? 너는 내 가족이야

내가 어디로 올 수 있니? 감독, 말하지 마세요 나는 오늘 날 소리 질러 손님은 그에게 들어 가라고 요청하는 손님입니다 그의 손님은 무엇입니까? 그건 중요하지 않아 나는 아직도 무언가를 가지고있다

내가 참여했을 때 나는 차 회장으로부터 선물을 받았습니다 필기가 생각보다 낫다 당신은 국회의원보다 기자로서 더 적합합니다 네가하는 말을 이해할 수 없다

하원 의원으로 선출 되길 바랍니다 이 사람 정말로 박수 갈채 체 지주 체시 나인 더 많이 먹어라 이 선거에서 승리가 있어야합니다 차 회장 셴 씨는 어떻게 아직도 오지 않을 수 있습니까? 곧 올거야 확인 박 감독 나는 미래에 우리 차사를 도울 것입니다

– 제발, 제발 – 좋아 고마워 피드 여기 Chexi Jiujian Office의 사무실이 있습니다 잠시만 기다려주세요

셴씨 전화 번호 회원 모두 준비 됐어? 의회가 오기를 기다리고있다 지금? 좋아, 나는 곧바로 통과 할 것이다 Shen Shen은 어떻게 말합니까? 나는 곧 돌아올거야 당신은 손님을 즐겁게합니다 나는 차 평의원을 알고있다, 당신은 길에서 조심성있다

체 지주 체시 나인 큰 소리로 큰 소리로 회원, 나는 Che Xijiu입니다 들어 오세요 너 여기서 뭐하고 있니? 모두가 지금 당신을 기다리고 있습니다 가자 당신은 앉아서 자신을 소개합니다

나 한테 소개시켜 줘? 누구? 부통령이 어떻게 여기에 왔습니까? 다시 만나자 다시 생각해주십시오 돈이 충분하지 않다면 아무리 너에게 줄 수 있든간에 너는 아무 문제 없어 당시 성숙하지 않았습니다 나는 전에 그것을 말했다

나는 내이를 돌려 보낼 것이다 네가 내 아버지를 죽이기가 힘들어? 이 사람들이 돌아 가게하십시오 너 모두들 나가는 걸 들었어? 온통 차장님 괜찮나요? 어떻게 괜찮을까요? 열심히 일하는 하원 의원은 그의 마음을 잃었다

[72초 시즌3 EP7] 나는 작가가 되기로 한다

제목 : EP7 나는 글쓰기를 좋아한다

라디오 쇼에 대한 이야기를 보냈습니다 그 당시에 프로그램의 요구 사항은 만남이 예정되어 있었다고 말하는 것이 었습니다 나는 여자 친구의 이야기를 들려 주었다 결과적으로, 호스트는 내 이야기를 읽을뿐만 아니라 "작가는 수준에있다" 그리고 나에게 온천 휴일 증빙을 보냈어 내 여자 친구와 함께 휴가를 보내 기쁘다

잠깐, 작가 수준? 세계의 눈을 조심스럽게 관찰하십시오 그리고 그 두 눈을 보아라 마술처럼 완벽한 손가락 이것은 내가 항상 소홀히 한 재능입니다 좋아, 나는 오늘부터 작가가되고 싶다 나는 카페에 앉아서 창작을 시작해야한다

음 주인공이 카페에 왔어 그런 다음 만들기를 시작하십시오 그의 직업은 작가이다

거친 커피 주문 웨이터가 멀리서왔다 음 그는 유명한 작가입니다 옷은 깨끗하고 신선합니다

그리고 여자가 다가오는 것을 보았을 때, 저는 제 자신과 이야기하기 시작합니다 글쓴이 : "커피는 물론 아메리칸 스타일을 마셔야한다" 그리고 여자는 말할 것이다 여자 : "너는 작가 야?" 그 후, 나는 앉아 있었다 그 여자는 관심을 가지고 그를 볼 것이다 여자 : "너 문학을 공부하니?" 매혹되어 보인다

글쓴이 : "아니, 이건 내 미성년자 야" 그 여자는이 일을 위해 마음이 따뜻해지는 것을 예견했다 그녀는 그녀가 볼 수 있는지 물었다 글쓴이 : "아무렇지도 않게 써라, 나는 아직 다른 사람을 위해 그것을 보지 못했다" 그리고 그 일을 상대방에게 넘겨 라 그는 작가 인 K라는 이름의 야외 카페에 앉아있다

그는 한 잔의 커피를 주문했다 여자 : "너는 작가 야?" 작가 : "그렇습니다 최근에 문학 전공으로 바뀌 었습니다" 여자 : "이거 저에게 쓰여졌습니까?" 이것은 운명의 배열이다 작가 : "내 말을 들어라 다음은 진짜 시작이다

" 그녀는 그녀의 눈으로 물었다 여자 : "너 나 보여줄 수있어?" 작가 : "당연히" 글쓴이 : "커피 숍에서 일하는 여자 이야기" Writer : "그녀는 갑자기 이런 생각을했습니다" 작가 : "저기있는 남자에게 물어보고 싶습니다 당신은 그의 작품을 읽을 수 있습니까?" 작가 : "이야기를 이해 한 후에 점차 이야기를 발견 할 것입니다" 작가 : "이야기의 주인공은 그 자신" 글쓴이 : "두 사람이 깊이 키스하기 시작할 것" 여성 : "아름다운 이야기예요" 여자 : "하지만 왜 내 이야기가 좋아?" 여자 : "어떻게 생각하니?" 글쓴이 : "두 사람이 깊이 키스하기 시작했다" 여자 : "이해해, 너는 근사한 사람이야

" 말하자면, 그녀는 점점 더 가까워지고있다 실제로, 그녀는 처음부터 그를 아주 좋아했습니다 이것은 운명의 만남이다 이것을 적어 두는 것이 좋을까요? 여자 : "너의 커피" 여자 : "너는 작가 야?"

Applied Machine Learning with Peter Norvig, Director of Research, Google AI

[음악 재생] 여러분, 환영합니다 아침 일찍 일어나서 깨어있게 해줘서 고마워

우리가하는 일에 대한 약간의 개요를주고 싶다 기업 접근 방식 측면에서 본다 기계 학습의 문제 그리고 여러분 모두 표준 모델을 알고 있습니다 너는 약간 자료, 몇몇 그림, 당신은 그것에 몇 개의 레이블을 붙인다

그리고 너는 그 TensorFlow 물건을 던져라 이익을 얻으십시오 어떻게 그럴 수 있죠? 항상 직접적인 것은 아닙니다 때로는 조금 더 복잡합니다 왜 그런가요? 음, 그런데 놀랄만 한 점이 있습니다

첫 번째 일은 우리가 외출 중이라는 것입니다 우리는 당신과 다른 사람들과 같은 회사와 이야기를 해왔습니다 너는 그 어려움이 무엇이라고 생각하니? 될 것? 당신이해야 할 모든 부분이 있습니다 목표를 정의하고 데이터를 수집하며, 인프라 구축, ML 알고리즘 최적화, 그것을 귀하의 제품에 통합하십시오 사람들의 기대는 음, 어려운 부분입니다

그 알고리즘 물건이 될 것입니다 그 모든 수학은 정말 어려울거야, 그렇지? 그리고 나서 그들은 나가서 실제로 그것을합니다 그리고 현실은 이것과 더 비슷합니다 수학 부분은 쉬운 부분이었습니다 그리고 어려운 부분은 데이터를 가져 오는 중입니다

인프라를 구축 한 다음 기계끼리 끼워 맞춤 통합 당신의 제품의 나머지 부분과 함께 학습 부분 그리고 수학 부분은 조금 작습니다 그래서 그것은 정말로 당신이 가진 일을 뒤엎는 것입니다 네가해야 할 일에서해야 할 일 그래서 우리가 함께하려고했던 것 이 현실과 오히려 일치하는 방법론입니다

기대치와 일치합니다 여기 몇 가지 함정이 반복해서 나타납니다 그래서, 모두들, 글쎄, 기계 학습 더 빨리, 더 좋게, 더 싸게 갈 것입니다 괜찮을거야 그렇지? 그리고 때때로 그것은 정말로 있습니다

때로는 수백 배 더 빠르게 작업을 수행합니다 그렇지 않으면 가질 수있는 것보다 가끔은 네가하는 일을하는거야 기계 학습 없이는 전혀 할 수 없었습니다 하지만 다른 때에는 더 길게 끝납니다 당신이하지 않은 방법론에서 뭔가 새로운 것을하고 있기 때문에 알아

그래서 처음에는 뭔가를하는 것이 어렵습니다 올바른 데이터를 가지고 있는지에 대한 문제가 있습니다 당신이 그것을 적절하게 선별했는지 등등 때때로 사람들은 그것을 잊어 버립니다 이 아이디어는 그것이 전부 또는 아님, 너는 기계 학습을하고 있거나 너는 매뉴얼을하고있다

그것은 아마도 그것을 보는 올바른 방법이 아닙니다 당신이 그것을보고 있어야하는 방법 어떤 하위 문제에 적절한 것이 무엇입니까? 그리고 그것이 100 % 자동화 된 것이 아니라고 말하는 것을 두려워하지 마십시오 아직 루프에 어떤 인간이 있다고 적절한 시점에 올바른 제품이 무엇인지 파악합니다 따라서 여기에 내가 최적화 할 수있는 척도가 있다고 말하는 것이 유혹적입니다

~ 99 % 하지만 내 제품을 만드는 데 도움이되지는 않습니다 그것은 당신이 최적화하고 싶은 것이 아닙니다 그리고 네가하는 것에 대한 질문은 사내에서 할 일, 사용할 도구, 그리고 당신은 그것을 어느 레벨에서 사용할지를 결정해야합니다 여기에는 많은 선택 사항이 있습니다

혼자서 모든 것을 만들 수 있습니다 이러한 사전 훈련 된 모델을 사용할 수 있습니다 다양한 회사들이 제공하고 있습니다 올바른 믹스가 무엇인지 알아 냈습니다 또 다른 걸림돌이되었습니다

이제 나는 조금 뒤로 물러서 고 싶다 기존 소프트웨어와 다른 점을 살펴보십시오 및 기계 학습 소프트웨어 그래서 전통적인 소프트웨어에서, 우리는 시작합니다 우리에게는 엔지니어 또는 엔지니어 팀이 있습니다

그들의 책상에 앉아 그리고 그들은 아이디어를 얻습니다 그런 다음 모든 의사 결정 포인트를 수동으로 코딩합니다 우리가 묘사해야 할 모든 가능한 것들 컴퓨터에 무엇을 할 것인가 그리고 어려움은 많은 다른 길, 그리고 너는 가지고있다

모두가 작동하는지 확인하십시오 그리고 그것은 전통적인 소프트웨어 수학 과학을 만듭니다 우리는 기본적으로 우리의 프로그램이 올바른지 증명하려고 노력하고 있습니다 물론, 실제 생활에서 우리는 단지 작은 장난감 프로그램을 위해 그렇게하십시오 우리는 실제 프로그램을 실제로 증명하지 않습니다

그러나 우리는 그 방향을 목표로하고 있습니다 그리고 우리는 불리언 논리를 사용합니다 그리고 우리는 확실하게 노력합니다 기계 학습에서, 그것은 아주 다릅니다 우선 프로그래머가 아닙니다

프로그램을 작성 그것은 프로그램을 작성하는 컴퓨터입니다 아직 인간을위한 장소가 있습니다 그리고 그것은 교사가되어 데이터를로드하고, 학습 방법을 시스템에 가르쳐줍니다 그리고 그것은 기계 학습을 만들고 소프트웨어를 만듭니다

경험적 과학 따라서 수학을하는 것보다 생물학을하는 것이 더 좋습니다 당신은 세계에 대한 이론을 만듭니다 너는 너의 이론을 시험해 그들은 결코 정확하지 않을 것입니다

논리적이고 부울하지 않습니다 그들은 확률 론적이다 그리고 당신은 오히려 불확실성을 포용합니다 그것을 제거하려고 노력하는 것보다 그래서 완전히 다른 사고 방식입니다

그리고 사람들이 그 변화에 적응하는 것이 어려울 수 있습니다 이제 당신이 문제를 바라 보는 방식 외에도, 우리는 방법론에서도 진전을 보였습니다 우리가 제품을 만드는 방법 그래서 우리는 시작했습니다 소프트웨어는 일종의 스튜디오 또는 장인이었습니다

들 차고 건물에 스티브라는 두 명의 남자가 있습니다 훌륭한 회사 그리고 물론, 그들은 나중에 많은 도움을 받았다 하지만 시작은 매우 작은 팀이었습니다

별로 방법론이 없었습니다 너는 바지의 자리에 그걸 다했다 하지만 그때 우리는 당신이 오직 얻을 수 있다는 것을 깨달았습니다 지금까지 그 작은 팀과 그래서 우리는 일종의 공장 모델을 발명했습니다

또는 우리가 말했던 조립 라인 모델, 우리는 어떻게 수천 개의 소프트웨어 팀을 만들 것인가? 엔지니어가 함께 일하니? 음, 그렇게하기 위해서, 우리는 많은 훈련을 강요 할 필요가 있습니다 및 방법론 그리고 우리는 기본적으로 반세기에 걸쳐 그것을 구축했습니다 하지만 이제는 우리가 공장 모델을 필요로하지 않는다고 말하고 있습니다 어쩌면 학교 모델과 같을 수도 있습니다

이제 우리는 교사들에게 가르치게 할 것입니다 컴퓨터가 무엇을 해야할지 그리고 우리는 그것을하기위한 새로운 방법론이 필요할 것입니다 그런데 우리가 가지고있는 도구는 무엇입니까? 그래서 나이가 들어서 프로그래밍을 시작할 때, 나는 실제로 이것들 중 하나를 가졌다 그리고 연필로 작은 흐름도를 그렸습니다

그게 유용하다고 생각한 적은 없지만 숙제에 A를 얻고 싶다면 그것을해야만했습니다 그래서 나는 말했다 그러나 시간이 지남에 따라 우리는 훨씬 더 강력한 도구 세트를 구축했습니다 그리고 이제 우리는이 모든 위대한 것들을 가지고 있습니다 우리에게는 교육 자료 및 방법론이 있습니다

그리고 프로그래머들은보다 생산적 일 수 있습니다 왜냐하면 우리는 반세기가 지났기 때문입니다 방법론 이제 기계 학습에서 우리는 이제 시작하고 있습니다 따라서 우리는이 수준의 도구를 사용합니다

우리는이 고대 도구들을 가지고 있습니다 그리고, 예, 시간이 지남에 따라 더 정교해질 것입니다 그리고 당신은 – 그곳에는 망치가 있고 톱 등이 있습니다 그리고 그들은 당신이 더 잘 될 것이라는 것을 압니다 그러나 우리는 처음부터 정말로 옳습니다

그리고, 우리는 도움이되는 훌륭한 도구를 가지고 있습니다 여기 TensorBoard가 있습니다 그러나 우리는 생태계 전체를 구축하지 않았습니다 우리는 전통적인 소프트웨어를 가지고 있습니다 그럼 어떻게 거기에 갈거야? 우리는 어떻게 기계를위한 방법론을 갖게 될 것인가? 학습 성공? 글쎄, 그것은 우리가 작업하고있는 것들 중 하나입니다

나는 우리가이 블로그에 당신을 가리키고 싶다 "The Lever"에서 일하고있다 더 빠르게 움직이고, 몇 가지 블로그를 살펴볼 수 있습니다 우리는 가지고있다 그리고 우리는 지금이 모든 말씀을 읽을 필요가 없습니다

그러나 그것은 이용 가능할 것이고, 당신은 가서 그것을 볼 수 있습니다 그래서 하나의 실험 아이디어가 있습니다 우리는 우리가 어디로 가고 있는지 정확히 알지 못합니다 그러나 우리는 그것에 대해 걱정하지 않아야합니다 그리고 우리는 신속하게 진전을 시도해야합니다

빠른 실험을하고, 결과를보고, 분석하고, 진행 방향을 변경합니다 제품 관리자가 기계와 통합되는 방식에 대한 아이디어 제품 관리자가 말하기의 규율에 익숙하다 우리가 쌓아야 할 것입니다 우리가 그것을 조각으로 나누는 방법은 다음과 같습니다 얼마나 오래 걸릴지 알아

각 조각을 만들 수 있습니다 나는 최종 제품을 구상 할 수있다 그리고 기계 학습으로, 항상 좋아하는 것은 아닙니다 얼마나 오래 차이가 있기 때문에 그것이 취할 것인가, 아니면 그것이 짝수 일 것인가 구성 요소를 만드는 것이 가능해질 것입니다 그런 다음 데이터는 어디에서 왔습니까? 데이터가 핵심이라면 데이터는 새로운 자본이고 기계 모든 것을 만드는 공장 바닥에 어디로 간다? 그것을 curating하는 과정은 무엇입니까? 데이터가 새로운 금으로 생각할 수도 있습니다

당신은 그 일을 잘 돌보고 싶습니다 당신은 투자하고 있습니다 당신은 올바른 투자를 원한다 올바르게 사용하는 방법을 알고 있어야합니다 그리고 당신은 더 많은 것을 위해 그 블로그를 볼 수 있습니다

그 아이디어 각각에 다시 말하지만 여기에서 다시 참조 할 수 있습니다 그러나 우리는이 다섯 가지 범주의 관점에서 도전을 생각합니다 먼저 기술은 무엇입니까? 이러한 모든 새로운 도구를 사용하고 데이터를 사용하며, 그것을 통해 흐름, 알아내는 어떤 모델이 합리적인지, 그 기술을 배치하는 것입니다

멋진 기술을 사용하는 방법 고객에게 적합한 제품에 적합합니까? 그래서 우리는 여기에 문제가있었습니다 회사 내에서 Google에 많은 일이 일어나고 있습니다 그리고 많은 훌륭한 연구가 진행되고 있습니다 그리고 훌륭한 제품 개발이 많이 있습니다 그러나 우리가 그 두면을 하나로 모으지 않는다면, 우리는 성공하지 못할 것입니다

그래서 저는 연구 책임자로서, 사진 팀이 우리에게 와서 말했습니다 우리는이 끔찍한 성공 재난을 겪습니다 사람들은 사진을 사용하고 있으며 제비 뽑기와 많은 그림을 가져 가고, 지금은 혼란스럽고 정리할 수 없습니다 자신의 사진을 찾을 수 없습니다 우리는 무엇을 할 수 있습니까? 그리고 그들은, 나는 우리가 필요하다고 생각한다고 말했다

인간이 할 수있는 몇 가지 요소입니다 사람들이 모든 사진을 폴더로 쉽게 분류 할 수 있습니다 그리고 우리는 그들에게 말했습니다, 예, 그렇습니다 그 중 일부는 인간의 요인 전문가 우리는 아마 조금 더 나아질 수 있다고 생각합니다

그러나 대신 우리가 자동으로 아무도 아무 시간도 낭비하지 않도록 모든 사진에 라벨을 붙였습니다 그들을 폴더에 넣어? 그리고 그들은 말했다, 당신은 그것을 할 수 있습니까? 나는 그것이 공상 과학이라고 생각했다 그래서 과학자가 인식하는 것의 대화였습니다 이 사람들은 필요와 제품 팀이 있습니다 이 녀석들에게는 기술이 있다는 것을 인정합니다

그리고 그 대화를해야합니다 당신은 그 사람들을 모아야합니다 그렇지 않으면 우리는 그 모든 노력을 낭비했을 것입니다 디자인 문제가 변경 될 수 있습니다 디자인이 어디로 향하는 지 보여주는 좋은 예였습니다

우리가 더 이상 없었던 많은 것을 바꾸는 폴더 구조가 어떻게 생겼는지 걱정 해시 태그는 모두 무엇입니까? 오히려 검색 창을 가질 것이라고 말할 수 있습니다 이제 결과가 어떻게되는지 알아냅니다 당신이 그 수색을 할 때처럼 따라서 사용자 경험은 상당히 다를 것입니다 그리고 나서 사람들의 문제

너 같은 회사에서 불만이 많다 이러한 기계 학습 전문가를 어떻게 고용 할 수 있습니까? 그리고 페이스 북은 그들 모두를 얻었다? 그래서 그들은 밖에 있습니다 그러나 생각할 다른 것 우리가 가진 전문가 중 일부는 당신이 원하는 사람들이 아닙니다 그래서 너는 갈 사람이 필요 없어 톱 컨퍼런스에서 논문을 쓰는 중 새로운 알고리즘을 발명합니다

필요한 도구는 기존 도구를 사용할 수있는 사람입니다 그것들을 하나의 제품으로 합치십시오 그리고 때로는 두 가지 유형의 사람들이 상당히 다릅니다 그리고 알고리즘에 대한 세계의 전문가 인 누군가 제품을 만드는 데 적합한 사람이 아닐 수도 있습니다 그러나 그것을 이해할 수있는 누군가가 그것을 할 수 있습니다

그리고 성장과 관련하여 많은 문제가 있습니다 우리는 기업이 첫 발걸음을 내딛는 것을보고, 약간의 성공을 얻은 다음, 약간의 걸림돌 그들이 앞으로 나아갈 때 이 문제를 둘러싼 많은 문제가 있습니다 그래서 문제의 일부는 당신이 처음 시작, 당신은 어떤 데이터를 던져 모든 것이 작동합니다 하지만 그렇다면 당신은 – 음, 이제 갑자기 우리가 성장함에 따라 프라이버시 문제가 발생합니다

또는 규제 문제가 있습니다 그리고 이것들은 당신이 생각하지 않는 것들입니다 방금 알고리즘을 개발할 때 뭔가를 얻으려고 노력하면서, 그러나 그것은 회사의 성공에 결정적 일 수 있습니다 여기에는 또 다른 부류의 사람들이 있습니다 Launchpad를 통해 배운 놀라운 것들 중 하나입니다

예, 우리의 다음 고용을 위해 말한 회사와 이야기하고있었습니다 우리가 엔지니어보다는 변호사를 고용하고 있다고 생각합니다 그리고 그것은 내 경력에서 처음이었다 나는 그 감정에 실제로 동의했다 [웃음] 그래서 나는 당신에게 모든 이슈들을 말했습니다

그리고 지금까지 그것은 부정적이었습니다 터프 해 그러나 당신이 할 수있는 멋진 것들이 있습니다 그들은 단지 놀라운 것입니다 그리고 더 많은 것이 있습니다

그래서 나는 그들 중 일부를 통과 할 것입니다 나는 우리가 관여하고있는 몇 가지 계약을 선택했다 나는 너희 회사의 회사를 선택하지 않았다 그건 네 애들 중 어떤 애가 말하는 것과 같을거야 가장 좋아하는 영화

나는 그것을 할 수 없다 그래서 너희들을 내쫓 았어 스탠포드 대학에서 천체 물리학자를 만난 팀이 있습니다 그리고 그들은이 문제를 다루고 있습니다 중력 렌즈 작용 (gravitational lensing)

그럼 그게 무슨 뜻 이죠? 거기에는 은하계가 있습니다 그리고 은하계에서 지구로 빛이 비추고 있습니다 그리고 그들과 우리 사이에는 또 다른 은하가 있습니다 그리고 그 은하는 무겁습니다 그래서 실제로 빛을 굴절시킵니다

그리고 무슨 일이 일어나고 있는지 정확하게 측정 할 수 있다면, 본질적으로 그것은 퍼팅과 같을 것이다 중간 규모의이 은하 빛이 얼마나 무거워 지는지 확인하십시오 그리고 너는 뭔가를 배울 수있다 어둠의 물질과 그 멋진 것들에 대해서 이 사람들이 신경 쓰는 것 그리고 그것은 물리학 자들이 어떻게 여기에서 시작 하자고 말하면 계산이 가능합니다

물리학 법칙을 순방향으로 적용하십시오 그리고 그것은 우리에게 알려줄 것입니다 우리가이 은하가 어떤 것인지 알면, 그 빛이 어떻게 생겼는지 알려줄 것입니다 그리고 일치하지 않으면 이 하나를 약간 조정하고 다시 시도하십시오 그리고 슈퍼 컴퓨터에서 오랜 시간이 걸립니다

왜냐하면 그들은 많은 시련을해야하기 때문입니다 그리고이 사람들이 말한 것은 우리는 물리학 자입니다 우리는 수학을 이해합니다 우리는이 기계 학습에 관해서 아무것도 모릅니다 그러나 우리는 깊은 학습에서, 차별화되고 거꾸로 갈 수 있습니다

앞으로 나아갈 것보다 그리고 그것이 바로 우리가 필요로하는 것처럼 보입니다 그래서 몇 달 만에 그들은 스스로 가르쳤습니다 그들이해야 할 모든 것 그들은 그것을 시도했다

기존 기술보다 효과적입니다 그리고 1000 만 배 더 빠르게 달렸습니다 그래서 그것은 아주 멋진 성공입니다 그리고 그들은 2 개월 만에 성공을 거두었습니다 물론, 이들은 물리학 자입니다

그래서 평범한 사람, 당신이 단어 텐서를 말할 때, 그들은 조금 긴장 해 그러나 물리학 자들은 그것을 아침 식사로 먹습니다 어쩌면 조금 더 쉬울 수도 있습니다 그들은 문자 그대로 로켓 과학자입니다 여기 또 다른 예가 있습니다

비슷합니다 행성을 찾고 저는 Google에 오기 전에 NASA에있었습니다 그리고 저는이 사명의 전조에 관여했습니다 그래서 나는 그것을 정말로 좋아한다

그리고 그 생각은 먼 저 별을 바라 보는 것입니다 그리고 한 행성이 그 별을 동그라미 낀다 그리고 일식이 있습니다 따라서 일식은 빛을 조금씩 차단합니다 그리고 케플러 선교사는 그것을 찾았습니다

그리고 정말로 크고 큰 행성들은 먼 별 앞에서 지나쳐 차단해라 빛의 많은, 그들은 그것들 모두를 발견했다 그리고 그것은 차가웠다 그러나 이제 우리는 돌아가서 말하기를 원했고, 더 작은 행성을 찾을 수 있을까요? 기존 기술은 그렇게하지 않았습니다 많은 불확실성

그것은 단지 하나의 요소가 아닙니다 그러나 기계 학습 기술 그 (것)들을 뽑을 수 있었다 그리고 이제 우리는 더 많은 행성을 발견했습니다 이미 발견 된 것보다 그리고 나는 오늘 아침 또 다른 비슷한 종류가 있다는 것을 보았습니다 오래된 데이터를 보면서 표준 기술을 끌어낼 수있는 곳 쉬운 예제, 기계 학습으로 돌아 가기 더 많은 예제를 찾는 것입니다

우리는 의학 분야에서 많은 연구를 해왔습니다 이것은 망막을 보는 문제였습니다 및 안구 질환 진단 그리고 우리는 일반 의사보다 더 잘 할 수 있음을 보여주었습니다 그러나 우리는 그 외에 무엇을 할 수 있을까요? 우리는 고혈압을 감지 할 수 있을지도 모른다고 말했습니다

밝혀 지 네, 우리는 정말 잘 할 수 있습니다 그리고 엔지니어는 계속 가고있었습니다 그들은 굴러 다녔다 그리고 그들은 말했습니다 우리가 데이터베이스에 있니? 기둥 중 하나는 섹스입니다

우리가 그것을 예측할 수 있는지 봅시다 의사가 말하길, 오, 잠시만 요 남성과 여성의 망막에는 차이가 없습니다 당신은 그것을 예측할 수 없을 것입니다 엔지니어들이 말했습니다

왜 95 %의 정확도를 얻었습니까? [웃음] 그리고 의사들은 아직도 우리가 왜 그렇게 할 수 있는지 알지 못합니다 그들의 눈에 대한 이론은 불완전했다 그리고 의학 응용 프로그램은 모든 방법으로 이동합니다 고등학생까지 그래서 저는 로켓 과학자들에 대해 이야기했습니다

20 년간의 경험을 쌓았습니다 여기에없는 아이도 있습니다 20 년 동안 살아 있었지만 아직은 이것에 기여할 수있었습니다 그것은 단지 아픈 사람들 이상입니다 그래서 우리는 병든 식물을 볼 수 있습니다

그래서 너는 열대 우림으로 나간다 나뭇잎이나 무언가에 갈변을 감지 할 수 있습니다 그리고 숙련 된 농부라면 무엇을해야할지 알 것입니다 그러나 아마도 당신은 경험 많은 농부가 아니며, 아니면 기후 변화를 통해 다른 종류의 질병을 얻는다 전에는 보지 못했던 일들을 도와 줄 수 있습니다

진정한 도전 과제 중 하나는 여기에 있습니다 말하자면, 우리는 수퍼 컴퓨터를 꺼낼 수 없습니다 필드에 아마도 Wi-Fi 연결이 없을 것입니다 따라서 전화를 통해 로컬로 실행해야합니다

그래서 큰 도전 중 하나는 말하자면, 우리는 어떻게 이러한 연산이 많은 어플리케이션 전화기의 크기까지 확장 할 수 있습니다 여전히 작동하게 만드시겠습니까? 그리고 우리는이 경우 할 수있었습니다 다른 하나가 있습니다 그리고 모든 회사는 엘리베이터 피치를 가져야합니다 당신은 회사를 발명했습니다

그리고 회사가 뭐니? 그리고 답은 틴더와 비슷하지만 고양이에게는 그렇습니다 Conectera라고 불리는이 회사는 엘리베이터 피치가 있어요 Fitbit 같아요 그러나 암소를 위해서 그리고 그것은 어리석은 것처럼 보입니다

암소가 실제로 얼마나 많은 단계를 자랑해야하는지 오늘 했니? 아니, 그들은하지 않는다 그러나 농부는 실제로 무슨 일이 일어나고 있는지 알고 싶어합니다 농부가 알고 싶습니다 내 젖소가 아플까요? 그들 중 누구도 비정상적인 일을하고 있습니까? 얼마나 많은 양의 물을 마십니까? 얼마나 많이 걷고 있습니까? 그들은 여기에서 저기로 어디로 가나 요? GPS와 가속도계가있는 장치를 놓습니다 이제 전체 무리에 대한 전체 그림을 얻을 수 있습니다

Wi-Fi 연결이없는 또 다른 예가 있습니다 그래서 우리는 불법 삼림 벌채를 탐지하고 싶었습니다 그래서 당신이 생각할 수있는 주요한 것은 – 몇 가지 다른 일이 진행 중입니다 -하지만 중요한 건, 너 할 수 있니? 나무를 자르는 톱 소리가 들리는가? 그들이 큰 소리가 나면 파워 톱입니다 그러나 거기에는 아무도 없습니다

그래서 많은 센서를 현장에 투입합니다 센서는 기본적으로 여기에서 볼 수 있습니다 몇몇 태양 전지가있는 휴대 전화예요 시간이 지남에 따라 전원을 계속 유지해야합니다 그리고 나서 전화는 서로 메쉬 네트워크를 형성합니다

그리고 그들은 듣고 있습니다 그리고 우리는 무언가가 진행될 때 우리에게 알려줍니다 비디오 캡션 – 그래서, 한편으로는, 우리는 오랫동안 음성 인식을 해왔습니다 이것은 쉬워야합니다 그러나 다른 한편으로는, 자막 비디오 일반 음성 인식보다 조금 어렵습니다

마이크에 직접 대고 말하면 한 사람의 이야기가 있습니다 그건 꽤 쉬운 문제입니다 하지만 동영상이 있고 일어나는 일이 많고, 여러 사람이 말하는 한 번에, 자동차 충돌 등등, 나쁜 마이크 등등, 그것은 훨씬 더 어려워진다 그리고 백 가지 언어 – 그래서 우리는 그 문제를 해결하고 그것을 모두 자동화하려고했습니다 그리고 우리는 그 분야에서 성공을 거두었습니다

하드웨어와의 인터페이스 – 그래서 나는 내 휴대폰으로 많은 사진을 찍는다 나는 크고 무거운 DSLR로 많은 사진을 찍는다 그리고 크고 무거운 렌즈를 원하는 이유 중 하나는 그게 당신이 배경을 흐리게 수 있습니다 그러나 우리는 소프트웨어에서도 그렇게 할 수 있습니다 그리고 여기에서는 그것을 사용할 수있는 예제를 보았습니다

여기에 더 많은 예가 있습니다 우리는 Geena Davis Institute와 함께 일했습니다 그들은 영화 산업의 편향에 관심이 있습니다 그래서 우리는 얼마나 오래 화면에 누가 있는지 분석하고, 누가 말하기 역할을하는지, 그리고 나서 남성 대 여성간에 공정합니다 그리고 여기에서는 기본적으로 차트를 봅니다

그것은 여성이 선두 인 영화에서 말하는 것입니다 여성은 더 자주 나타납니다 많은 반면 남성이 선두 인 영화에서, 그것은 훨씬 더 비뚤어졌습니다 그래서 우리는 여기서 편견을 발견했습니다 그리고 그걸 구성 요소로 분해 할 수 있습니다

등등 그리고 더 많이 보아라 그리고 그것은 모두 자동으로 이루어졌습니다 이전에 그들은 매우 느린 진전을 보이고있는 반면 모든 프레임에 손쉽게 주석을 달아서 한 번에 모든 것을 할 수 있습니다 그래서 여기서 멈추고 질문을 위해 열어 보겠습니다

하지만 저는 그곳에 여기에 강력한 기회가 있습니다 당신이 할 수있는 많은 것들이 있습니다 그리고 우리는 진화를 계속하고있는 일련의 도구들을 가지고 있습니다 그리고 당신은 그 반쯤 만난다 너 내가 원한다고 말할 수 있어야 해

이 기술과이 방법론을 채택합니다 그리고 거기에 약간의 충돌이있을 것입니다 나는 많은 것을 발견하게 될 것이다 그건 나에게 새로운 것이지, 모두에게 새로운 것이있다 그러나 그것으로 우리는 많은 기회를 볼 수 있습니다

성공하고 일을하기 위해 너는 달리 할 수 ​​없었다 그렇다면 지금 질문에 대해 열지 않으시겠습니까? 네? 관객 : 가장 과대 평가되고 과소 평가 된 것은 무엇입니까? 현장에서 본 기계 학습의 응용 현재? 피터 노빅 : 글쎄, 후보자일지도 몰라 둘 다이 조수입니다 그래서 우리는 당신이 말하고 대화 할 수 있어야합니다 그리고 지금은 많은 사람들이 작은 연설자에게 중점을두고 있습니다

키보드가없는 탁자 위에 놓을 수 있습니다 화면이 없지만 당신의 말을들을 것입니다 그리고 이것들은 꽤 인기가있는 것으로 판명되었습니다 그리고 사람들은 그것들을 사고 말합니다, 아, 이거 정말 멋집니다 나는 음악을 연주하도록 요청할 수 있으며, 올바른 노래를 연주한다

그리고 날씨를 물어볼 수 있습니다 그리고 그것은 나에게 날씨를 알려준다 그리고 잠깐, 내가 물어볼 수있는 또 다른 것은 무엇입니까? [웃음] 따라서 그것이 할 수있는 일의 측면에서 큰 성공입니다 하지만 지금까지 실패한 점은 당신이 할 수있는 모든 것을 알아 냈습니다 반면에 다른 애플리케이션에서는 Google 검색에서 우리는 사용자에게 작품의 좋은 모델을 제시했습니다

그리고 작동하지 않는 것 기본적으로 몇 가지 키워드를 입력하면됩니다 해당 키워드와 관련된 페이지를 보여 드리겠습니다 사람들은 그 모델을 이해합니다 그리고 그들은 힘의 균형이 무엇인지를 안다

구글이이 금액을 할 것이라는 것입니다 그러나 사용자는 또한 정통한 사람을 데려 와야합니다 올바른 질문을하고 결과 페이지를 분석하는 것 이 비서들과 함께, 우리는 아직 거기에 있지 않습니다 그래서 우리는 그것이 사람과 같은 것이라고 말하는 것의 중간 정도입니다

당신은 사람과 이야기하는 방식으로 이야기합니다 그러나 우리는 또한 말하고 있습니다 글쎄, 실제로는 사람이 아닙니다 그것은 모든 것을 이해하지 못합니다 글쎄, 그때 그걸 어떻게 이해하니? 우리는 아직 명확하게하지 않았다

그리고 나는 시간이 지남에 따라 – 음, 하나, 능력이 확장됩니다 점점 더 많은 일을 할 수있게 될 것입니다 하지만 더 나은 사용자 인터페이스가 필요합니다 당신이 그것을 어떻게 생각해야하는지에 관해 말하는 것은 여기에서 그것이 할 수있는 일의 글쎄, 그건 자란 사람이 아니야

8 살이야 그것을 생각할 수있는 방법입니까? 아니, 그건 맞는 모델이 아니야 그래서 우리는 그것을 더 분명하게 할 어떤 방법이 필요합니다 고맙습니다 네? 청중 : 사람들이 해결하려고하는 문제가 있습니까? [알아들을 수 없는]? 피터 노르 비그 : 예, 문제가 있습니다

사람들이 기계 학습을 시도 할 것입니다 그리고 그들은 할 필요가 없다? 확실히 그럴 것입니다 그리고 유지하는 데 몇 가지 이점이 있습니다 가능한 한 간단합니다 따라서 중장비 기술을 사용하지 마십시오

쉬운 사람이 사용할 때 확실히 많은 예제가 있습니다 편익이 너무 작아서 편한 편이다 그것이 자동으로 아니더라도, 손으로 그것을 할 수 있습니다 그리고 아마도 손으로 그것을하는 비용이 있습니다

그러나 그것은 여전히 ​​큰 노력에 투자하는 것보다 쉽습니다 설명 형 문제도 있습니다 그래서 Google 검색을 할 때 알아 역사적으로 우리는 조금 저항했습니다 기계 학습에 너무 많은 통제권을 넘기는 것

그래서 우리는 항상 이런 생각을했습니다 검색에 관련되어 있으며 새로운 요소를 창출 할 것입니다 관심을 가져야하는 정보 또는 사용자가 상호 작용하는 방식 그들의 역사에있는 페이지와 함께 그것은 데이터입니다 우리는이 데이터를 사용하여 제품을 향상시킬 것입니다

그리고 우리는 종종 말을 잘하고, 우리가 알아 냈어 이제 이것을 추가 할 것입니다 얼마나 더 추가해야합니까? 음, 기계 학습 알고리즘 이러한 매개 변수의 올바른 값을 알아낼 것입니다 그러나 우리는 항상 말하기를 꺼려했습니다 모든 것을 하나의 깊은 학습으로합시다

네트워크 우리가 기계 번역에서 말하는 방식 그리고 나는 거기에 몇 가지 이유가 있다고 생각합니다 하나는 우리가 일종의 훈련을 만드는 것입니다 우리가 따라갈 때 데이터 그래서 자연스러운 데이터는 없습니다

이미지 처리를 원할 때, 세계에 자연의 그림이 있습니다 그러나 자연적인 예는 없다 우리가 만드는 검색 및 결과 이외의 검색 결과 그래서 우리가 그 데이터를 훈련한다면, 그리고 우리는 우리가하는 일을 바꿉니다 이제 데이터가 더 이상 유효하지 않습니다 우리를 걱정시키는 또 다른 문제는 우리가 몇 가지 단계를 앞두고 생각해야했던 것처럼 느껴졌다

왜냐하면 초기에 우리는 우리 직업이 웹 관찰하기 우리는 도서관 카탈로그와 같았습니다 다른 사람이 그 물건을 출판하고 우리는 단지 그것을 분류합니다 그 다음 우리는 우리가 실제로 그것과 상호 작용하고 있다는 것을 깨달았습니다 알고리즘을 변경할 때마다 웹 마스터는 우리가 한 일을 연구하고 그들이하는 일을 바꿀 수 있습니다

따라서 현재 데이터를 최적화 할 수는 없습니다 우리는 우리가 변화를 가졌다면 무슨 일이 일어날 지 말해야합니다 미래에 어떻게 될까? 그리고 그 알려지지 않은 미래에 대한 데이터는 없습니다 그래서 우리는 무슨 일이 일어나고 있는지 정말로 이해해야 만하는 것처럼 느꼈습니다 그리고 모든 것이 기계 학습 모델 일 뿐이라면, 미래가 어떻게 바뀔지 예측하는 것이 어려웠습니다

반면 몇 가지 기계로 손으로 작성한 코드라면 학습 된 매개 변수를 사용하면 더 쉽게 수행 할 수 있습니다 이것이 우리가 꺼려했던 한 가지 예입니다 그리고 이제는 시간이 지남에 따라 더 많은 기계 학습을 할 때, 우리는 더 많은 자신감을 갖게되고, 더 많이 몰래 움직이고 있습니다 검색 알고리즘으로 네? 관객 : [INAUDIBLE] 네, 그렇다면 데이터와 당신의 관계는 무엇입니까? 일반적으로? 그리고 그것은 어려운 질문입니다 대답이 하나도 없습니다

데이터를 어디에서 얻을 수 있는지 알아야합니까? 그것의 얼마를 필요로합니까? 그것이 어떻게 선별되거나 조작되어야합니까? 그리고 거기에는 여러 경로가 있습니다 그래서 때로는 데이터가 이미 거기에 있습니다 가서 찾아서 수집 할 수 있습니다 그리고 때로는 다른 사람들에게서 그것을 얻을 수 있습니다 때로는 그것을 만들어야합니다

그리고 많은 예제가 있습니다 초기 제품을 만들어 상호 작용을 얻으십시오 사용자와 그리고 나서 당신은 그런 종류의 부트 스트랩을합니다 그래서 우리는 예를 들어 음성 인식에서 그러한 작업을 수행했습니다 우리는 사람들의 예를 많이 갖고 싶었습니다

말하고 결과를 얻는 것 그래서 우리는 무료 서비스를 제공합니다 전화 번호에 대한 전화 번호 안내 그리고 사람들은 [비상업적 인] 사업을 요청할 것입니다 그리고 나서 우리는 답을 줄 것입니다

그리고 나서 우리는 말할 수 있습니다 우리는 올바른 답을 얻었는지 아닌지를 알아낼 수있었습니다 그들은 사업에 연결했기 때문에? 그래서 우리는 데이터 수집에 투자했습니다 그리고 많은 시간을 할애해야합니다 그렇다면이 질문은 무엇입니까? 익스텐트는 귀하의 특별 응용 프로그램입니다

다른 사람에게 일반적인 대 이제 Google 및 다른 회사를 볼 수 있습니다 이 사전 훈련 된 모델을 제공하고 있습니다 음성 인식이나 이미지 인식 또는 텍스트 작업 가공 등등 세상의 모든 것에 그리고 한 가지 접근 방법은 그것을 사용하는 것입니다

또 다른 한가지는 그것을 사용하는 것입니다 일부 데이터를 추가하여 수정하십시오 그리고 다른 접근 방법은, 아니요, 제 신청서는 그것은 그것을 사용하는 것이 전혀 도움이되지 않는다는 것이 었습니다 내 데이터로 처음부터 시작해야합니다 그리고 그 질문에 대한 답은 없습니다

너 스스로 조사해야 해 올바른 경로가 무엇인지 확인하십시오 곧 관객 : 그럼 해석 가능성 조각에, 기계 학습에 대해 어떻게 생각하십니까? 인간 지식의 진보와 관련이 있기 때문에? 망막보기 에서처럼 의사 마치 눈의 모형처럼 결과를 얻는다 개선되었지만 실제로는 그렇지 않습니다 그들은 실제로 그 지식을 가지고 있지 않습니다

그것에 대해 어떻게 생각하세요? 네 그래서 그것은 좋은 질문입니다 그래서 보자 그래서 이것은 당신에게 힌트를줍니다 그리고 저는 우리가 실험을하는 방법이 많이 있다고 생각합니다

데이터를 얻습니다 우리는 그것을 이해하지 못합니다 그리고 여러분은 돌아가서 새로운 이론을 만들어야합니다 그리고 저는 항상 그렇게 생각합니다 그리고 실험과 이론의 도약이 있습니다

그리고 지금은 기계가 달라질 수 있습니다 학습은 훨씬 더 강력한 도구를 제공합니다 실험을하기 어쩌면 과거에는 많은 영리한 인간이 있었을 것입니다 그리고 이론은 실험을 유도했을지도 모른다

보다 더 자주하지 그러나 많은 발견은 항상 있습니다 누군가가 말 했잖아, 웃긴다 나는 이론이 있다고 말하는 것보다 예기치 않은 결과가 있습니다 이제 설명 할 수 있을까요? 그래서 기계 학습은 그 호기심을 일으키는 데 도움이 될 것입니다

그것은 설명 자체를 도울 수 있습니까? 저는 이것이 우리에게 많은 개선이 필요한 부분이라고 생각합니다 그래서이 차트 중 일부를 보여주었습니다 데이터와 결정 경계의 공간을 볼 수 있습니다 등등 그리고 그것은 당신에게 약간의 아이디어를줍니다

그러나 더 나은 대화를 나누려면 더 나은 도구가 필요합니다 기계 학습 알고리즘 그것이 실제로하고있는 것을 이해합니다 그리고 다른 문제는 사람들이 혼란 스럽다는 것입니다 때때로이 이해력의 문제와 함께, 그들은 알고리즘을 비난한다 문제를 비난해야합니다

이해할 수있는 것들 간단한 용어로 설명 할 수있는 것들입니다 그래서 제가 수표 책의 균형을 잡고 싶다면, 나는 옳은 대답이 무엇인지 묘사하는 방법을 안다 그리고 나는 그것을하기위한 프로그램을 작성하는 방법을 안다 그리고 정확하게 정확하게하기 위해서는 복잡 할 수도 있습니다 하지만 본질적으로 그것은 간단한 문제입니다

그래서 그것을 해결하는 코드는 이해할 수 있어야합니다 프로그래밍 언어와 상관없이 또는 당신이 그것을 쓰는 데 사용하는 시스템 누군가의 얼굴을 알아보는 반면, 그것은 본질적으로 어려운 문제입니다 종종 정답이 정답이 아닐 수도 있습니다 여기 얼굴이 있습니다

그게 누구에게 속한거야? 전문가들은 옳은 대답에 동의하지 않을 수 있습니다 아무도 정답이 없습니다 그리고 둘째로, 그것을 발견하는 과정 의식이 없다, 말할 수있는 전문가가 없다 이것이 제가 그 결정을 한 방법입니다 오히려, 나는 그것을 어떻게했는지 모른다

내 잠재 의식의 정신은 내 의식의 마음보다 그것을했다 그래서 사람들은 기계 학습 알고리즘을 비난합니다 그 두 가지 문제를 해결하지 못했을 때 알고리즘의 잘못 사실이야 그 문제는 시작하기가 어려웠다

관객 : 안녕하세요 나는 아주 기본적인 질문을 가지고있다 기계 학습 문제를 어떻게 식별합니까? 특정 [부적절한] 문제가 있습니다 [INAUDIBLE]에는 여러 장소가 있습니다 기계 학습을 적용 할 수 있습니다

그래서 나는 아직도 실제 사용법을 찾는 방법을 알아 내고있다 기계 학습을위한 케이스 네 내 생각 엔 그게 경험이 될 것 같아 그래서 우리 제품 관리자가 사진 팀이 문제를 확인하지 못했습니다

그들은 그것이 가능하다는 것을 몰랐다 그들이 시도 할 수있는 그래서 당신은 어떤 비슷한 문제에 대해 최신 정보를 입수해야합니다 사람들이 작업 해 왔습니다 그래서 오늘 내가 너에게 보여주고 싶었던거야

다양한 가능성, 단지 여기에 대해 생각하게하려면 사물의 종류가 있습니다 할 수 있습니다 그래서 당신은 그 아이디어를 발휘할 필요가 있습니다 여기 다른 누군가가 한 일이 있습니다 이것은 내가하고있는 것과 비슷하게 보입니다

그리고 나서 당신은 그것을 분석 할 수 있어야합니다, 말하자면, 거기서 성공하려면 무엇이 필요합니까? 적절한 종류의 데이터가 필요합니다 올바른 종류의 객관적인 기능이 필요합니다 나는 사용자에게 그 유대 관계를 필요로하고 그들에게 유용 할 것이다 따라서 제품을 정의 할 수있는 단계를 파악합니다 그리고 더 자주 당신이 그것을할수록, 당신은 그것에 나아집니다

연설자 1 : 우리는 한 번 더 질문 할 시간이 있습니다 네 관객 : 실제로 얼마나 자주 실행 가능합니까? 모델을 유용하게 실행되는 것으로 축소 너무 복잡하다 대 휴대 전화에 컴퓨팅을 위해 클라우드로 이동할 필요가 있습니까? 피터 노르 비그 : 그래, 우리는 확실히 지출하고있어 더 많은 시간을 할애해야합니다 다행히도 많은 모델이 훨씬 쉽습니다

그들이 훈련하는 것보다 달릴 수있다 따라서 교육 과정은 복잡합니다 하지만 전화로 가져올 수 있다면, 나는 다양한 것들이 있다고 생각한다 그것들은 꽤 잘 덮여있다 폰은 정말 강력합니다

이제는 항상있을 필요가없는 한 지금 관객 : 예, 짧은 파열에있는 한 상호 작용의 피터 노르 비그 : 우리는 아직 그 지점까지 도달하지 못했습니다 하루 종일 휴대 전화에서 동영상을 실행할 수 있습니다 길고 모든 장면을 분석합니다

오래 전에 배터리가 소모됩니다 그러나 우리는 그 방향으로 일하고 있습니다 그래서 저는 여러분이 기본적으로 답을 말해야한다고 생각합니다 나는 그 일을 할 수 있습니다 그러면 문제는 어떻게 작동하게합니까? 그렇다면 모델을 컴파일하는 과정은 무엇입니까? 그리고 그것을 충분히 작게 만들어서, 너무 배고파하지 않게 만드시겠습니까? 얼마나 자주 모델을 업데이트해야합니까? 클라우드에서 다시 계산하고 다운로드하십시오

무엇을 다운로드합니까? 프라이버시 문제는 무엇입니까? 전화에서 실행되는 모델을 사용하면 당신이 지주의 책임으로부터 면제받을 수 있다는 것입니다 누군가의 개인 정보 전화가 켜져 있다면 그들의 문제가 아니라 당신의 문제 그리고 당신은 고소 당할 수 없습니다 해당 데이터를 복구 할 수는 없습니다

그러나 단점은 데이터를 수집하지 않는 경우입니다 당신은 개선 가능성을 이용하지 않습니다 그래서 많은 연구가 있습니다 지금 당신이 매개 변수를 공유 할 수있는 방법에 드러내지 않고 네트워크를 위해 밑에있는 데이터의 비밀 그리고 나는 그것들이 진짜 문제라고 생각합니다

언제 어디서 실행되는지에 대한 아키텍처 업데이트되고 데이터 흐름은 어떻게됩니까? 하지만 만약 내가 그 문제를 해결할 수 있습니다, 나는 그것을 전화로 실행할 수 있습니다 관객 : 차가워 요 고맙습니다 알겠습니다 네

고맙습니다 [박수 갈채] [음악 재생]

AutoML Vision and Designing Product Experiences at Google (Google Cloud AI Huddle)

[음악 재생] PUNEITH KAUL : 우선 Cloud AI Huddle에 오신 것을 환영합니다 내 이름은 Puneith입니다

클라우드 AI 엔지니어링 팀에 있습니다 AI 개발자 옵션에 중점을 둡니다 그래서 다시 당신에 관한 것입니다 나는 당신이 두 개의 링크를 체크 아웃하도록 초대하고 싶습니다 bit

ly/aihuddle, TLDR에는 AI Huddle이 있습니다 개방적이고 협업적인 개발자 우선 포럼, 이는 Google AI 전문 지식에 의해 주도됩니다 그리고 이것은 Google 직원과 소통하는 포럼입니다 그리고 우리는 당신의 AI 문제를 해결하도록 도울 것입니다 그리고 두 번째 것은 우리가 지난 주 발표되거나 발표 된 클라우 사이 근무 시간은 다음과 같습니다

여전히 조종사입니다 그리고 그것은 당신이 연결할 수있는 프로그램이나 VC, 가상 컨텐트, Google 직원과 함께 문제에 대해 이야기하십시오 당신은 직면하고 있습니다 차단 해제하는 가장 좋은 방법입니다 정말 빠른 방법으로

그리고 나서 우리의 전체 클라우드에 대해 빠르게 외쳐라 AI 커뮤니티 어제 현재 회원수는 950 명입니다 그리고 다시 한 번 당신에게 큰 소리 쳐요 열의 때문에 정말 고마워

그리고 단지 일종의 기세를 계속하십시오 AI 여행에서 차단 해줄 수 있도록 도와주세요 그것으로, 나는 그것을 Shantanu에게 넘겨 줄 것이다 Shantanu, 가져가 SHANTANU PAI : 안녕하세요

나는 샨타 누다 Brian이 놀랍지 만 빠른 소개를 할 것입니다 나는 우리가이 모든 것을 빨리 처리 할 수 ​​있는지 모른다 그러나 Brian Kobashikawa는 수석 인터랙션 디자이너입니다 Google의 Cloud AI 팀에서 그리고 오늘 볼 워크 플로 Brian이 디자인했습니다

그래서 기본적으로 처음부터, 처음부터, 0에서 오늘 볼 수있는 것까지 가고, 그것은 놀라운 여행이었습니다 그리고 우리는 최근 AutoML Vision을 출시했습니다 그래서 당신은 어느 정도까지, 우리가 실제로 디자인 결정에 어떻게 도달했는지 Brian은 이전에 Google 소재 디자인 팀에서 일했습니다 그리고 그 전에는 여러 미국 기관에서 일했고, 리드 비주얼 디자이너로서의 여러 해를 포함하여 야후 메신저 및 야후 메신저

너에게, 브라이언 BRIAN KOBASHIKAWA : 좋습니다 음, 고마워 모두들 나들을 수 있니? 괜찮아 그래, 그래

나는 오늘 밤 의제가 가고 있다고 생각한다 상당히 간단하다 AutoML Vision에 대한 소개로 시작하겠습니다 사무용 겉옷 그런 다음 데모에 들어갑니다

희망 사항은 라이브 데모입니다 그 다음에, 나를 때리는 부분 내 관점의 두드러진 부분으로 사용자 경험이나 UX에 대한 깊은 이해입니다 결과적으로 이야기는 아마도 아마 이전의 AI와 조금 다르다 그것은 매우 집중하고 있다는 점에서 만남 Google에서 제품 경험을 어떻게 디자인했는지, 특히 초기에 떠오르는 AI 공간 우리가 무수한 UX 문제를 해결하기 위해 어떻게 노력하고 있는지 이러한 경험을 통해 존재합니다 먼저, 소개부터 시작합시다

AutoML Vision에 그리고 그걸 시작하기 위해, 우리는 컴퓨터에 대한 사명을 가지고 있습니다 비전 그룹 전반 이는 개발자가 차세대 애플리케이션을 개발하는 데 도움이됩니다 컴퓨터 비전 기반 자치 솔루션 여기이 파란색 막대는 작업 영역을 나타냅니다

우리가 집중하고있는 것은 우리의 예비 훈련 된 기계입니다 학습 API 및 AutoML AutoML 존재 – 세 가지 제품이 있습니다 불과 몇 달 전에 Google Next 2018에서 출시되었습니다 그것은 AutoML Vision, AutoML 자연 언어, 및 AutoML 번역

ML API 및 AutoML의 기초 기술과 연구 그리고 수십 년간의 Google Machine Perception 팀에서 문제가 발생했습니다 TensorFlow 및 클라우드 호스트 TPUs에 대한 투자 이러한 제품의 개발을 주도하십시오 차례 차례로 다양한 다른 유스 케이스를 몰 수있다 그리고 이러한 유스 케이스는 매우 다양하거나 광범위한 영역에 걸쳐 있습니다 시력의 경우와 마찬가지로 에너지에서부터, 풍력 터빈에서 부식 지점을 감지 할 수있는 것처럼, 예를 들어 소매업에 이르기까지 제품 카탈로그가있는 곳 사진의 물체를 인식하려고합니다

해당 카탈로그와 일치하는 그래서 그것이 나온 것처럼, 사전 학습 된 기계 학습 Vision API 인 API는 실제로 많은 유스 케이스를 다룹니다 그래서 그것은 pretrained 모델입니다 그것은 다양한 특징을 가지고 있습니다 cloudgoogle

com/vision에서 자세한 내용을 확인할 수 있습니다 그러나 여기에 다양한 기능이 있습니다 아래쪽 4 개는 오른쪽 하단에 필기체 OCR, 제품 검색, Object Localizer 및 웹 탐지 7 월에 다음 2018 년에 발표되었습니다 하지만 다양한 사용 사례가 있습니다 이러한 기능은 광학 문자 인식, 스캔 및 전송 가능 대량의 종이 문서, 라벨, 로고 감지, 일반적인 색상과 같은 이미지 속성 또는 지배적 인 색

그래서 사전에 준비된 Vision API는 많은 것을 처리 할 것입니다 이 특별한 경우 중 또한 클라우드 웹 사이트의 ML API 섹션으로 이동하면 Video Intelligence API가 있다는 것을 알 수 있습니다 자연어 API, 번역 API가 있습니다 번역 API는 실제로 잠시 동안 사용되었습니다

그러나 문제는 찾고있는 데이터가 또는 당신이 가고있는 목표 다른 도메인에 속해 있고 당신 이러한 매우 구체적인 개념을 지원할 필요가 있습니다 반드시 Vision API에서 다룰 것인가? 그리고 아마 데이터 과학자가 올 수있는 대답 일 것입니다 와 함께 그들이 자신의 컴퓨터 비전을 만들 것입니다 모델 그리고 여기까지, 우리는 매우 거칠게 다른 단계 그 모델을 구성하는 것 그러나 그런 식으로 다양한 질문이 있습니다

데이터 과학자들이 요구할 것입니다 그리고 이것들이 떠오르는 질문들입니다 UX 연구 및 기타 이니셔티브에서 우리가 과거에 해왔 던 예를 들어 데이터 전처리를 할 때, 당신이 물을지도 모르는 질문들 중에는, 어떤 전처리 기술을 사용해야합니까? 내가 모델의 다음 몇 단계로 넘어갈 때 디자인 및 이러한 매개 변수를 조정할 수있는 질문 그 사용자들이 물어볼 것은, 음, 어떤 기술을 사용해야합니까? 심오한 학습을하고 있다면 어떤 아키텍처인가요? 내가 선택해야하고 어떤 종류의 하이퍼 파라미터 나는 튜닝해야 하나? 그런 다음 평가 단계로 넘어 가면 이 목표를 달성하기 시작합니다 그 데이터를 분석 할 수 있다는 점에서, 어떤 측정 항목이 가장 중요하거나 가장 중요한지 이해하기 내 목적과 관련이있다 내 모델이 실제로 잘 작동하는지 어떻게 알 수 있습니까? 내 데이터를 실제로 향상시킬 수있는 방법은 무엇입니까? 내가 재 훈련해야한다면, 실제로 더 나은 결과를 얻을 수 있을까요? 그리고 배포를 위해 주위에 질문이 있습니다

어떤 인프라를 사용해야합니까? 대규모로이 모델을 제공 할 수 있습니까? 또는 전반적인 대기 시간 목표를 어떻게 달성합니까? 그런 다음이 업데이트 프로세스가 있습니다 그런 다음 이전 단계로 돌아갑니다 그래서 당신은이 질문들을 여러 번해볼 수도 있습니다 이제 데이터 세트를 검토하고 개선하기 시작합니다 그리고 당신이 길을 따라이 질문들에 대답 할 때, 니가하는 것처럼 꽤 비싸기 시작할 수있어

이 모든 다른 경로를 선택하기 시작합니다 어떤 조합이 가장 잘 작동하는지 확인하고 결과 그리고 나서 언제든지 당신이 목표를 바꿀 것이라고 말하면됩니다 또는 주위를 이동하면 많은 경우 처음부터 다시 시작해야합니다 AutoML을 사용하여 살펴본 점 모든 복잡한 단계를 밟을 수 있습니다

ML 모델을 만들고 어떻게 든 자동화 할 수 있습니다 우리가 보여줄 방법은 우리가 사용자 인터페이스에서 어떻게 표시되는지 확인하십시오 그러나 AutoML의 목표는 무엇입니까? 요점은 실제로 수집하는 데 집중할 수 있다는 것입니다 올바른 데이터를 파악하고 올바른 비즈니스를 정의 할 수 있습니다 목표를 갖고 있으며 여전히 모델을 가지고 있습니다

생산에 배치 할 수있는 충분한 품질 워크 플로가 그 다음에 나타납니다 증류수가 될거야 일부 교육 이미지로 데이터 세트 작성 및 레이블 이를 AutoML에 전달하면 모델 교육의 전 과정을 수행하고, 모델 배포 및 Google에서 모델 제공 구름 그리고 나서 결국 간단한 REST 인터페이스가 완성됩니다

그러한 유형의 예측을하기위한 것입니다 그렇다면 AutoML은 현재 어떤 유형의 기능을 사용하고 있습니까? have 또는 AutoML Vision은 현재 가지고 있습니까? 글쎄, 우리는 단일 레이블 분류가 있습니다 이 경우 이미지가 있어야 할 수도 있습니다 여러 클래스 중 하나 일뿐입니다 여기에 우리가 가져온 예가 있습니다

다른 구름을 구별하려고하는 곳입니다 전체 물리적 특성에 기초하여 서로 유형을 짓는다 또는 이러한 구름의 시각적 속성 그리고 이것은 이러한 입력 중 하나 일 수 있습니다 날씨가 어떤지를 잘 보여주기 위해 같이 될 것입니다

그것의 다른면은 다중 라벨 분류 일 것이다 여기서 이미지는 여러 클래스를 가질 수 있습니다 그래서 한 가지 예가 아마도 당신 일 것입니다 이 거대한 라떼 아트 데이터베이스를 만들고 싶습니다 그리고 당신은이 모든 다른 지표들을 가지고 있습니다

이 라떼 아트가 가져야 할 속성의 유형 그리고 언제 어느 시점에서 당신은 – 언제 사람들이 라떼 아트의 새로운 이미지를 업로드합니다 그들은 자동으로 분류하고 쉽게 검색 할 수 있습니다 그리고 모든 것 그러나 이것은 당신이 반드시 깃털이 라떼 나 에칭보다 우승하기를 원한다 모카를 이기기 위해

하지만 오히려 그들은 마치 공통 속성을 공유합니다 두포에서 일어나는 일은 AutoML이 실제로 AI를 사용하여 인공 지능을 만듭니다 우리가 의미하는 바는 우리가 실제로 소개하는 것입니다 데이터를 AutoML에 제출하면, AI 에이전트가 들어 와서이 모델을 만들 수 있습니다 깊은 학습 기술을 사용하여 해결할 최적의 아키텍처와 하이퍼 매개 변수 집합을가집니다

귀하의 특정 비즈니스 요구 그리고 그것이 4 월에 돌아온 것처럼, 나온이 기사가 나왔다 이 일본어 연구원은 라면의 사진을 찍을 수 있습니다 그리고 Ramin Jiro라는 가게가 있습니다 40여 곳이 있습니다

이 연구원이 할 수 있었던 것은, 제가 믿습니다 각 상점에서 1,000 장의 사진 AutoML에이를 전달할 수 있어야합니다 약 24 시간 동안 훈련 시키십시오 모든 것이 끝나고 끝나면 어떤라면 가게가 왔는지 예측할 수있었습니다 95 %의 정확도와 같은 것에서 94 포인트 뭔가의 퍼센트 또는 94 점의 퍼센트 퍼센트 정도

흥미로운 사건이었습니다 왜냐하면 저는 나 자신은 거대한라면 팬이다 그래서 나는 – [웃음] 인공 지능에 관한 기사로 당신이 침을 뱉는 것은 매우 드뭅니다 하지만 그것은 부부 중 하나가 될 것입니다 하지만 어쨌든

UX가 참여하기 시작하는 곳 사용자 스토리를 만드는이 모든 과정 및 시나리오 그래서 우리는 간단한 것으로 시작하겠습니다 그럼이 사용자부터 시작하겠습니다 제인 한테 전화 할게 그녀는 야생 생물 보호 구역의 개발자입니다

Cloud Vision API에 익숙한 것일 수도 있습니다 그러나 그녀는 일반적으로 일반적으로 API를 구현하는 것에 익숙합니다 그녀는 많은 양의 이미지를 가지고 있습니다 그러나 그녀는 직접적인 ML 경험이 거의 없습니다 그녀는 ML 열혈 팬 중 한 명입니다

그리고 불행히도,이 사진은 조금 씻겨 냈습니다 하지만 그것은 날지 못하는 새의 작은 실루엣입니다 바로 거기 그래서 그녀가하고 싶은 것은 조류 분류자를 만드는 것입니다 그래서 그녀는 경험을 향상시킬 수 있습니다

그녀의 조류 관찰 앱 어쩌면 일어나는 일이 그녀는 Vision API, 사전 교육 된 Vision API, 그녀의 많은 라벨 기술이나 라벨 작업을 처리 할 수 ​​있습니다 그러나 에뮤를 구별 할 수있는 경우 화식 조로부터, 레어에서 타조로, 그녀는 그 문제를 해결할 더 많은 커스텀 모델을 만들고 싶습니다 그래서 그녀가 이것을 할 수있는 방법은 무엇입니까? 음, 몇 가지 다른 접근 방법이 있습니다 하나는 그녀가이 오즈 오브 마법사 방식을 사용할 수 있다는 것입니다

사용자가 이미지를 제출하면 그녀는 은밀하게 이 이미지들을 가져 와서 인간 라벨링 풀에 보내라 어딘가에 들어가서이 이미지에 라벨을 붙입니다 그것을 돌려 보내 그런 다음 데이터베이스에 의해 색인이 생성됩니다 그러나 이것이 어디에서 시작되는지 알 수 있습니다

장기적으로 모든 것을 확장 할 수있는 것은 아닙니다 사용자 수에 따라 비용이 증가합니다 증가하다, 그녀가 확장하기로 결정하면 그녀는이 4 가지 수업을 넘어서서 그녀가 어떻게 상호 작용 하는지를 복잡하게 만든다 이 라벨링 서비스 그녀가 몇 초 만에 결과를 원한다면 몇 분 또는 며칠이 아닌 그녀에게 맞는 솔루션이 아닐 것입니다

또 다른 가능성은 그녀가 Vision API를 사용할 수 있다는 것입니다 그러나 앞에서 언급했듯이이 카테고리 반드시 충분히 구체적 일 필요는 없다 그녀의 유스 케이스를 만난다 세 번째 옵션은 몇 개의 슬라이드를 다시 가져온 것입니다 그녀는 모델을 쓸 수 있다는 것입니다

그러나 그녀의 인물 묘사에 언급 된 바와 같이, 그녀는 ML 전문가가 없다 그 모델을 만드는 것 그래서 우리가 궁극적 인 해결책으로 제공하는 것 Google이 기본적으로 할 수있는 AutoML Vision을 사용하는 것입니다 자신의 이미지와 라벨을 모델로 훈련 시키십시오 그래서 이것이 우리가 데모에 들어가는 곳입니다

그리고 잘하면,이 작동합니다 그래서 셋업으로 birds라는 폴더를 만들었습니다 왼쪽에 그리고 그 안에 네 개의 폴더를 만듭니다 내가 원하는 다른 레이블들로 그런 다음 각 폴더 내에서 나는 단지 내가 원하는 모든 이미지를 던졌다

타조 또는 emu 또는 레어를 표시합니다 그래서 내가 여기 갈 수 있다면 – 나는 여기 갈거야 그리고 이것이 AutoML Vision 인터페이스입니다 이것은 내가 새로운 데이터 세트를 만드는 것입니다 그래서 나는 여기에 가서 말할 수있다

좋아, 나는이 새들을 불러 줄 것이다 그리고 여기에서 내 이미지를 가져올 수 있습니다 세 가지 옵션이 있습니다 그래서 하나의 옵션이 나의 목적에 적합한 옵션입니다 기본적으로 내 컴퓨터에서이 이미지를 업로드하는 것입니다

여기서 나는이 파일들을 선택한다 그리고 나는 말할 것이다, OK 이 새들을 가져갈 게요 [INAUDIBLE] 그리고 그렇게 팝니다 우리가 가진 다른 주요 옵션 Google Cloud Storage에서 CSV 파일을 선택할 수 있다는 것입니다 그리고 이것은 특히 유용 할 것입니다 지나치게 많은 양의 이미지가있는 경우, 이 경우 Google Cloud Storage의 엄청난 수의 이미지를 얻기위한 도구 귀하의 데이터 세트에 다른 가능성은 당신이 교육 유효성 검사 테스트를 제어하려고합니다

split으로 지정할 수 있습니다 CSV 파일 자체 내에서 어떤 버킷으로 들어가야하는지 여기에 약간의 코드가 있습니다 그 검색 구문이 어떻게 작동하는지 설명합니다 이미지의 위치에 대한 경로가 있습니다

Google Cloud Storage에 있습니다 그리고 쉼표로 그 뒤에옵니다 그 다음에 레이블을 붙이십시오 그런 다음에 훈련, 검증 또는 시험에서, 당신은 훈련, 검증, 또는 테스트 그리고 이것은 아마도 약간의 사용자를위한 것입니다

더 진보 된, 그것은 데이터 분할이 작동하고 그 주변의 우수 사례가 있습니다 그래서 우리는 반드시 그것을 표면화하지는 않습니다 이 시점에서 우리는 자동으로 분할을 처리합니다 그들이 지금 비워두면 그리고 세 번째 옵션은 나중에 이미지를 가져올 수 있습니다

그래서 그들은 기본적으로 빈 데이터 세트로 시작합니다 그리고 인터페이스 자체를 통해, 그들은 이미지를 던져 라벨을 붙일 수 있습니다 UI 내에서 수동으로 라벨을 지정하십시오 인간 라벨링 서비스를 이용하거나 또한 UI에 내장되어 있습니다 그리고 마지막으로 여기있는이 옵션은 기본적으로 분류 유형은 다음과 같습니다

기본적으로 단일 레이블 분류입니다 그러나 선택 사항으로 이 다중 라벨 분류 그래서이 시점에서 Create Data Set를 누르십시오 그런 다음 일정 시간 머문 것입니다 데이터 세트의 크기에 따라 다릅니다

그러나 나는 이것을 생각한다 약 20 ~ 30 분 정도 하지만 여기서 20 ~ 30 분을 기다리지는 않을 것입니다 왜냐하면 나는 정말로 많은 것을 가지고 있지 않기 때문에 그 시간 동안 말하기

그래서 내가 끝내게 될 것은 내가 단지 실제 생성 된 데이터 세트로 건너 뜁니다 그래서, 잘하면,이 작품 그래서 내 인터넷 연결은 하루 종일 괴롭다 그럼 우리가 보겠습니다 그래서 여기, 내 zip 파일을 업로드 한 후입니다

양식 작성을 통해 그리고 20, 30 분 후,이 브라우저에서이 브라우저에 나타납니다 그래서 가져온 모든 이미지를 볼 수 있습니다 여기에 그들과 관련된 레이블이 있습니다 그리고 내가 할 수있는 일은 특정 레이블로 좁힐 수 있습니다 여기에이 항목을 클릭하면됩니다

그래서 저는 화식 조로 그것을 좁혔습니다 그들은 여기있을거야 그리고 나는 내 타조를 본다 내가 할 수있는 일은 내가 갈 수 있다는거야 여기에있는 개별적인 이미지들에 대해서 말하자면, 이 특별한 이미지는 여기에 있습니까? 가설이 아니라면, 이것은 emu가 아니라고 가정 해 봅시다

그것은 실제로 타조였습니다 나는 여기에 가서 타조라고 말할 수 있는데, OK를 누르십시오 그런 다음 해당 데이터 세트를 업데이트합니다 그래서 하나씩 들어가서이 이미지들을 업데이트 할 수 있습니다 또는 여기에서 선택할 수 있습니다

그리고 당신은 클릭을 할 수 있습니다 – 여기를 클릭 선택 또는 다중 선택을 할 수 있습니다 여러 이미지를 만들고 레이블 버튼을 누르십시오 그리고 말하기 위하여이 심상의 대량 재 포장을하십시오, 예 : emu 여기에 모두 내장되어 있습니다 또한 라벨 목록을 처리하기 위해 제작되었습니다

따라서 여기를 필터링 할 수 있습니다 그래서 저는 화식 조로이 방법으로 걸러 낼 수 있습니다 또는 여기에서 select를 검색 할 수 있습니다 여기에 필터가 있습니다 그래서 그것은 존재를 향한 방향으로 향하게됩니다

100 개 정도면 수백 가지 레이블을 잠재적으로이 경우에 있습니다 Train 탭으로 이동하면, 이것은 다음 단계 일 것입니다 그리고이 시점에서, 보통 나는 제품에 대한 클릭 유도 문안이 요구된다 내가 새 모델을 훈련 할 수있게 해줘 그래서 나는이 사람을 클릭한다

그리고 저는 말할 수 있습니다 좋습니다, 이것이 제 모델입니다 그리고 한 시간 씩 훈련 시키겠다 예산은 매월 처음 10 개 모델에 대해 무료입니다 나는 또한 지정할 수있는 옵션이있다

더 많은 수의 계산 시간 우리는 나중에 할 것입니다 따라서 교육 요청을 제출하면 그것은 또 다른 시간 동안 머문다 이 경우에는 약 15 분에서 20 분 정도 걸렸습니다 그래서 이렇게 생긴 모델을 만들었습니다

오늘 아침 두 모델을 훈련 시켰습니다 사실, 이것은 이보다 약간 더 잘 수행되었습니다 그래서 내가 얻는 결과는 평균 정밀도는 0947입니다 그리고 내가 익숙하지 않은 사람이라면 이 특정 값에이 도구 팁을 살펴 보겠습니다

말하자면, OK, 무엇이 09라는 것을 의미합니까? 그리고 만약 여기에 10이 최대 점수라고한다면, 그래서 그것은 지금 꽤 잘 보이는 것을 의미합니다 나의 정확성과 회상은 훌륭하지만 위대하지는 않습니다 그래서 내가 할 일은 내가 택할거야

전체 평가를보고 무엇이 진행되고 있는지 확인하십시오 클릭하여 전체 평가보기 이 목록의 세 번째 탭 인 평가 탭입니다 여기에서 모든 라벨 패널을 살펴볼 수 있습니다 이러한 정밀도 리콜 그래프에 대해 자세히 살펴보십시오 그래서 점수 기준을 이것이 정확도 리콜 그래프에 어떻게 영향을 주는지 봅니다

1에서의 정밀도로 1 그래프에서 호출합니다 따라서 고급 ML 사용자의 경우 어떤 문턱 값이 가장 좋은 거래를 할 수 있는지 여기에서 볼 수 있습니다 정밀도와 리콜 사이 또는 그들이 리콜쪽으로 더 고정시키고 싶다면, 그들은 그것을 여기 위로 옮길 수 있습니다 [INAUDIBLE]만큼 위양성으로 더 많이 생성됩니다

그리고 내가 이걸 여기로 옮기면, 그러면 정밀함을 향해 더 고정시킬 것입니다 여기 아래에는 혼란 행렬이 있습니다 그래서 이것은 당신에게 4 x 4의 진정한 레이블을줍니다 예측 된 라벨 대 그리고 내가 여기 이것을 볼 때, 화식 조와 에뮤의 경우, 그것은 실제로 꽤 잘 수행했습니다

타조 들어, 확인을 수행 85 %는 좋지만 특히 좋지는 않습니다 그러나 레아 수업에서 정말 고생했습니다 그리고 타조와 레어가 꽤 혼동스럽게 보입니다 그리고 지난 며칠 동안 새들을 보았습니다

[웃음] – 그것들은 훨씬 작아 보이지만 실제로 레어처럼 보입니다 새와 그들은 다른 대륙 출신이다 나는 그들이 아프리카와는 반대로 남미 출신이라고 믿는다 그들은 타조처럼 놀랍습니다 그리고 그것은 제가 완전히 알지 못했던 것입니다

그래서 제가 여기로 가면 구체적인 정밀 리콜을 볼 수 있습니다 이 특정 레이블에 대한 곡선 그리고 진정한 긍정의 목록을 볼 수 있습니다 이 특별한 라벨을 위해 돌아왔다 그래서 이들은 모두 다른 레어입니다

그리고 위양성의 일부를 볼 수 있습니다 따라서 이것은 올바르게 식별 된 사진이 될 것입니다 레어처럼했지만 050 점수 한계를 넘지 못했습니다 여기서 지정 했어

그리고 여기 아래는 제가 가진 오 탐률입니다 그래서 이것들은 레어 (rhea)로 분류 된 것들입니다 이들은 타조 사진입니다 그러나 우리는 어떤 이유에서 건 레아를 예측하지 못했습니다 이 경우처럼 이것은 분명히 타조입니다

하지만 어떤 이유에서든 레알 레이블은 어떤 이유로 든 그것을 밖으로 날카롭게했다 그리고 그 이유가 무엇이든간에 이 모델이 어떻게 작동하는지에 대한 직감을 구축하십시오 이것들이 공식화되도록 허용하기 시작한다 흥미있는 후속 조치 모델을 개선하기 위해 다음에해야 할 일은 무엇입니까? 잠재적으로 할 수있는 한 가지 옵션 우리가 여기서 말하는 것은 기본적으로, 데이터 세트에 더 많은 이미지를 추가하려면, 이것은 아마 당신이 당신의 모델을 향상시킬 수 있습니다 내 라벨 통계를 보면 실제로 단지 몇백 개의 이미지 만 업로드했습니다

각 라벨에 대해 그리고 화식 조와 에뮤 (emu) 내 말은, 아마도 이걸로 충분할지도 모르지 꽤 잘하는 것 같습니다 하지만 타조에게는 400 개의 이미지가 있습니다 레어 (rhea)에는 200 개의 이미지 만있었습니다 아마도 레알 이미지를 추가해야 할 것입니다

내 측정 항목을 얻을 수 있는지 알아보기 위해서 내가 할 수있는 또 다른 가능성 이 이미지들 좀 봐주세요 어쩌면 내가 잘못 라벨을 붙 였는지 보지 이 이미지들 중 일부 이 경우처럼, 이건 마치

지상 진실은 타조입니다 그러나 이것이 실제로 레어라고 생각합니다 그리고 아마도 나는이 이미지를 잘못 간략히 살펴본 것 같습니다

내가 할 수있는 또 다른 일 여기의 이미지 탭으로 되돌아갑니다 내 레어 섹션과 기본적으로 이동 스캔하여이 모든 것이 있는지 확인하십시오 레어이고, 마찬가지로, 타조 섹션으로 간다 이들 중 어떤 것이 실수로 발생했는지 확인하십시오 그들이 정말로 타조해야 할 때 레어로 확인되었습니다

이것이 아마도 내가 할 수도있는 무언가 일 수 있습니다 아니면 내가 직장 동료에게 맡길 수있는 것입니다 어쩌면이 데이터 세트를 CSV로 내보낼 수 있습니다 이 파일을 오프라인에서 살펴보십시오 그것에 대해 갈 여러 가지 다른 방법이 있습니다

그런 다음 마지막으로 할 수있는 옵션 기본적으로이 모델에서 더 많은 계산 시간을 소비합니다 그래서 우리는 하나의 계산 시간만으로 그것을 훈련 시켰습니다 실제로는 약 15 ~ 30 분 정도 걸립니다 그러나 내가 새 모델을 훈련 시키려고한다면 훨씬 더 실질적인 교육 예산을 제공하고, 더 많은 컴퓨터 시간을 버는 것이 가능합니다 나에게 똑같은 데이터로 더 좋은 모델을 줄 것이다

그러나 이것은 당신이 최대한으로 활용할 수있는 것입니다 하지만 사용자 정의 할 수도 있습니다 아마 처음에는 두 가지를 시험해보기를 원할 수도 있습니다 그리고 어떻게 일들이 수행되는지보십시오 그리고 나서 다시 가서 훈련을 다시 시작할 수 있습니다

계산 시간이 추가로 필요합니다 그래서 몇 가지 다른 옵션이 있습니다 내 처분에 들어가서 개입하고 보았다 내가이 모델에서 더 나은 성능을 쥐어 짜낼 수 있다면 그런 다음 사용자가 할 수있는 마지막 단계 이 Predict 섹션으로 이동합니다

이것은 일종의 진리의 순간과 같습니다 이 버튼을 클릭하고 일부 보류를 업로드 할 수 있습니다 이미지 그래서 나는이 이미지를 가지고있다 이것은 emu 인 것처럼 보입니다

그러면이 것이 실제로 작동하는지 알 수 있습니다 그리고 네 0996 % 점수로 에뮤를 예측 한 것 같습니다 타조는 약간 표현되었지만, 레어 약간 표현

그러나 그것은 심지어 거의 미소하지 않기 때문에 그만큼 중요합니다 그리고 점수 한계점을 05로 설정했다면, 그런 다음에는 에뮬레이션으로 등급이 매겨집니다 아래에 아래에 코드 샘플이 두 개 있습니다 그러면 사용자 정의 모델을 구현할 수 있습니다

따라서 REST API에 대한 일부 스 니펫을 제공합니다 그리고 당신은 작은 미니 파이썬을 보러 여기로 토글 할 수 있습니다 스크립트를 사용하면 당신이 가진 사람이라면 손에 많은 훈련 이미지가 있지만 어쩌면 반드시 필요한 것은 아닙니다 많은 프로그래밍 경험, 당신은이 사람을 데려 갈 수 있습니다 복사하여 붙여넣고 웹 개발자에게 보냅니다

이봐, 여기서 도와 줄 수 있니? 이걸 일할 수 있는지 알아봐? 그러나 그 동안에는 모델 자체가 예측을 위해 쉽게 사용할 수 있습니다 기본적으로 워크 플로의 길고 짧은 것입니다 다시 프레젠테이션으로 돌아가겠습니다 그래서 여기에서 우리는 위로 만들 수 있습니다 이 모든 것이 어떻게 어울리는 지에 대한 몇 가지 아이디어, 다른 조각처럼

불행히도, 경계가 있습니다 그 4 개의 상자를 가운데에 동그라미로 표시합니다 하지만 이는 Google Cloud Platform 시스템을 나타냅니다 그리고 당신이 상상할 수있는 하나의 워크 플로우 사용자가 자신의 컴퓨터에서 새 이미지를 업로드했을 가능성이 있습니다 Google Cloud Platform으로 전송됩니다

클라우드 스토리지에 저장되면 Pub / Sub Google Cloud를 통해 새로운 이미지 알림을 트리거합니다 그런 다음 App Engine으로 전송됩니다 검색 색인은에 기반합니다 App Engine이 할 수있는 일은 AutoML Vision API를 호출하고, 좋아, 나는이 세 가지 새로운 이미지를 얻었다 이 이미지들은 어떤 모습입니까? 또한 AutoML Vision API는 예를 들어, 글쎄, 이건 타조 야

이건 에뮤 야 레어 야 App Engine의 검색 색인에 저장하십시오 5 단계에서 사용자는 타조를 검색 할 수 있습니다 또는 레아와 그 결과를 얻을 수 있습니다 자동으로 태그를 추가했습니다

이제 한 발 뒤로 물러나 깊게 잠수 해 봅시다 사용자 경험 따라서 사용자 경험 또는 UX는 가장 일반적인 용어로, 적어도 Google에서는이 세 가지로 느슨하게 분할됩니다 다른 가지 UX 연구, UX 설계 및 UX 프로토 타이핑이 있습니다

그리고 당신은 하나가 다른 하나를 먹는 것을 보았습니다 실제로 숨겨진 화살표가 있습니다 그것은 그 자체로 되돌아 간다 그래서이 세 가지에 대한 입문서처럼 서로 다른 분야가 있으므로 UX 연구는 모두 문제 공간을 이해하십시오 그리고 그것은 이해 관계자와의 인터뷰를 통해 이루어질 수 있습니다

고객과 함께, 학술 연구를하고, 전체 스펙트럼으로부터 통찰력을 얻을 수있다 의미있는 분석을 제공 할 수있는 출처 번역 할 수 있도록 결과를 해석합니다 UX 설계뿐만 아니라 실행 가능한 단계로 프로토 타이핑뿐만 아니라 제품 관리 팀, 엔지니어링 등 그러나이 토론의 범위까지, UX 연구의 주요 인공물 내가 뿌리 내린 영역 인 UX 디자인에 참여하십시오 그리고 모든 것이 주변에 있습니다

흐름, 전체 사용자 여행, ​​방법 제품이 시각적 정보로 구성된다는 것 계층 적 관점 또한 시각 디자인 및 모션 디자인을 포괄 할 수 있으며, 전환이나 웹 구성 요소 같은 것들이 사용되고 있습니다 그들이 어떻게 생겼는지, 미학은 그런 종류의 영역의 모든 부분 그런 다음 UX 프로토 타이핑에 들어가며, Google의 UX 엔지니어링이라고도합니다 이것이 바로이 모든 설계 및 연구를 수행 할 수있는 능력입니다

아티팩트를 유형의 것으로 캡슐화합니다 이해 관계자, 다른 팀에게 보여줄 수있는 정보 회원들 – 명세로 또는 시범으로 – 또는 가장 중요한 것은, 우리의 경우, UX 연구 참여자에게 그래서 이것은 우리에게 초기의 모습을 보여줍니다 꼭 필요한 디자인이 될 것입니다 사물의 구현 측면에 너무 깊이

그리고 UX 필드에서 프로토 타이핑이 나타나는 방식 그것은 다양한 수준의 충실도가 필요하다는 것입니다 매우 낮은 충실도의 범위 에서처럼, 일련의 종이 조각처럼 그것들에 다이어그램이 많이 있습니다 당신은 순차적으로 보여 주며, 주변에서 섞여 있습니다 Google 프레젠테이션과 같을 수 있습니다 갑판이나 PowerPoint 데크에서 볼 수 있습니다

그들은 참여자를 통해 또는 이해 관계자를 통해 참여합니다 그러나 다시, 매우 높은 충실도로 실제로는 세미 인터랙티브 또는 완전 인터랙티브 제품입니다 참가자가 직접 상호 작용하고 어떻게 볼 수 있는지 이것이 그들의 기대를 충족 시키는가? 그래서 이것이 드러나는 한 가지 방법입니다 라이브 데모와 같은 AutoML에 있습니다 내가 여기서 보여준 것

이 다른 탭은 바로 UX 프로토 타입입니다 우리가 오래 동안 만들었던 것 그리고 이것은 기본적으로 실제 데이터가 아닌 것을 사용하고 있습니다 UX 패턴과 구성 요소를 많이 사용하고 있습니다 사용자의 기대에 어떻게 맵핑되는지보기 위해 우리의 디자인이 어떻게 시작될 지 알 수 있습니다

도청에 직접 뛰어 들지 않고 생각하고있다 백 엔드와 프런트 엔드의 무리를 만드는 엔지니어 무리 테스트가 잘되지 않을 수있는 수정 그리고이 경우에, 여러분은 그것이 – 이것은 모두 상당히 기능적입니다 당신은 들어가서 많은 이미지를 선택할 수 있습니다 일부 레이블을 지정하고 모든 종류의 작업을 수행 할 수 있습니다

일반적으로 실제 제품으로 수행 할 것입니다 그러나 이것은 모두 연기와 거울을 통해 모두 이루어집니다 기본적으로 다소 본질적으로 일회용과 비슷합니다 도구를 사용하여 신속하게 반복 할 수 있습니다 한 가지 예는 불행히도 이 화면에서 특히 잘 보입니다

원래 우리가 혼란스러워했던 곳 이었어 행렬로 시작했다 양수 값 또는 일치 항목이있는 위치 녹색이었다 부정적인 것은 빨간색이었다 그러나 적색 / 녹색 색맹은 반드시 필요한 것은 아닙니다

그 중심에 녹색의 대각선 스트립이 보입니다 실제로는 모두 노란색 또는 갈색 음영처럼 보입니다 그래서 우리가했던 것은이 프로토 타입을 사용하는 것입니다 몇 가지 다른 색상을 시도 할 수있는 수단으로 팔레트, 볼 수있는 것, 오, 좋아, 푸른 회색 테마로 어떻게 보이는지 보자 우리는 궁극적으로 여기에 파랗 – 주황색 주제에 정착했다

그것은 두 사람 사이에 상당한 양의 눈에 띄게하기 때문입니다 그러나 우리가 전환 할 수있는 능력 반드시 서로 다른 변형 사이에 영향을 미치지 않고 나머지 흐름이나 크랭크 아웃 많은 추가 모형이 중요한 조각 중 하나였습니다 우리가 이걸 가지고 나왔어 또 다른 빠른 예는 찾고있는 것입니다 여기에있는이 이미지 중 하나에서

오른쪽에서 예측을 볼 수 있습니다 그러나 우리가 생각하고있는 한 가지는, 음, 우리가 원하는대로 레이아웃을 조정해야한다면 어떨까요? 반대쪽에이 열이 왼쪽에 표시됩니다 친구 엔지니어에게 요청하는 것, 이걸 시험해보고, 그것이 어떻게 느껴지는지보십시오 우리는 측면에서 시도해 볼 수 있습니다 이 특정 레이아웃의 장단점을 확인하십시오

일이 더 가독성 있고 덜 읽을 수있게됩니까? 이 방법과 Google의 이전 제품과 상호 작용 구름, 등등? 다시 프레젠테이션으로 돌아 가면 여기에 우리가 일련의 반복을하기 시작했을 때, 우리는 여러 번의 테스트를 거쳤습니다 연구의 측면에서 반복의 무리로 이끌었다 디자인 측면에서 반복의 무리를 이끌어 냈습니다 프로토 타이핑 측에서 일련의 UX 학교가 등장하기 시작합니다

워크 플로의 어느 부분에서 몇 가지 예가 있습니다 이러한 목표들이 드러납니다 그래서 첫 번째 것은 존재하는 것입니다 사용자의 정신 모델을 접지 할 수 있습니다 그게 우리가 결국 전통적인 ML 워크 플로우를 취합니다

예, 반일 과정이지만이 경향이있다 다시 원을 그리며 모델을 평가 한 후 특정 시점에 도달하고, 다시 원을 그리며 더 많은 이미지에 레이블을 지정할 수 있습니다 이 과정을 다시 거쳐야합니다 그러나 결국 목표는 결국 여기 마지막 단계에서 시작해서 다른 하위 작업 또는 사용자 스토리가 무엇인지 확인하십시오 다음과 같은 다양한 주제와 이 단계들 각각의 일부

그래서 그것은 상당히 똑 바른 것처럼 보일 수도 있습니다 글쎄, 사용자로서 데이터 세트의 이름을 지정하여 나중에 사용자가 원하는 반면 단일 레이블 분류인지 여부를 지정합니다 또는 다중 라벨 분류 수입면에서 – 다른 쪽에서는 사용자로서 코드 샘플에 액세스 할 수 있도록 내 모델을 구현하고 배포 할 수 있습니다 그리고 우리가 통합의 일종을보기 시작하는 곳 워크 플로의 이러한 여러 단계를 매핑 할 수 있는지 확인했습니다

응용 프로그램 자체 내의 특정 상태로 그리고 그것이 어디서 시작되는지는 불행히도, 조금 씻겨 버렸지 만 여기에 Create Form이 있다는 생각 이 탭으로 연결되는 왼쪽에 이 네 단계를 포함하여 여기에 설정하십시오 그리고 당신은 심상 사이에서 토글 할 수있다, 평가하십시오, 테스트 및 사용, 또는 예측

탭이므로 탭을 탐색 할 수 있습니다 뒤로 및 앞으로 그래서 여기 – 조금 더보기 쉬울지도 모르지만, 또는 Create Form이 있습니다 그리고 나서 여기 왼쪽 상단의 이미지가 보입니다 교육, 평가 및 예측 – ML의 4 단계를 나타내는 특정 순서대로 돌아갈 수있는 흐름 특정 순서대로 앞으로 이동하십시오

모든 단계를 수행 할 필요는 없습니다 그러나 아직도 앞으로의 추진력이 있습니다 이 마지막 단계로 당신을 이끌어갑니다 최전선에 올랐던 또 다른 작품 새로운 개념에 대해 사용자를 교육 할 수있었습니다 그리고 "새로운"의미는 사용자가 새로운 것을 의미합니다

ML 전문 지식이 거의 없습니다 그래서 이것은 점진적 공 개 (progressive disclosure) 이전에 보여준 도구 팁과 마찬가지로, 음, 평균 정밀도는 이상하고 안개가 끼는 개념입니다 ML 전문 지식이없는 사람들에게 그리고 정밀도 리콜, 그들은 직관적으로 들립니다 하지만 추가 텍스트를 제공해야 할 수도 있습니다 이 특정 용어에 대한 명확성을 높이는 데 도움이됩니다

그래서 이것은 우리가 해왔 던 것입니다 반복되는 두 번의 반복 작업을 수행했습니다 우리가이 언어를 점점 더 많이 만들 수 있는지 알아보기 위해 이해에 어려움을 겪을 사람들에게 분명히 이러한 광범위한 개념 그래서 우리가하는 것이죠 아직 진행중인 작업입니다

또한, 구별하는 것 위음성과 위양성 우리가 더 충분히 조사 할 영역이 될 것이다 상세보기에서 우리는 예측 목록을 보여주었습니다 여기에 레이블과 점수 목록이 있습니다 그들은 받았다 그러나 우리는 또한 여기이 작은 별에 의한 진실의 진리 였어

그리고이 레이블은 05 이상이기 때문에이 레이블을 나타냅니다 네가 정한 점수 한계점 이었어 그건 진실이 아니야 우리는 거짓 긍정으로 간주합니다 그리고 그 사이에, 이것은 0

5보다 작 으면 그 별은 거짓입니다 따라서 이러한 개념을 계속해서 다시 도입하려고합니다 다시 제품 자체를 통해 또 다른 것은 우리가 더 많은 것을 생산하기 위해 노력하고 있습니다 사용자 교육을 UI에 직접 주입하십시오 AutoML Vision은 어느 정도 간단합니다

그리고 우리는 두 가지 다른 제품을 가지고 있습니다 앞서 언급 한 'Next'도 마찬가지로 그래서 우리는 AutoML 자연어, 이는 기본적으로 AutoML과 같은 원리입니다 시력 그러나 기본적으로 자유 형식, 구조화되지 않은 텍스트 같은 문서 그리고 그 주위의 유스 케이스는 – 그와 관련된 다양한 것들이 있습니다 아래에 아래에 AutoML 번역이 있습니다

그것은 기존의 것을 취할 수있는 것에 관한 것입니다 번역 API와 그것을 보강 할 수있는 능력 특정 사용 사례로 특정한 필요 나 특정 단어 나 숙어가있는 경우, 현재의 번역이 모국어 인 조각들 API의 전체 시리즈가 있다면 API가 어려움을 겪고 있습니다 문장 쌍, 당신은 그것을 AutoML 번역에 전달할 수 있습니다 이를위한 맞춤형 모델을 구축 할 수 있습니다 AutoML에 대한 자세한 내용은 이 링크로 이동하면 실제로 여기에서 반복됩니다

그리고 이것은 또한 근무 시간을 홍보 할 수있는 기회이기도합니다 따라서 근본적인 문제에 대해 많은 질문이있는 경우 AutoML에 대한 기술 또는 AutoML의 사용 방법에 대해 자세히 알고 싶습니다 후드 아래에서 작동합니다 가능합니다 근무 시간을 통해, 우리는 당신과 짝을 지을 수 있습니다

그 지식을 더 많이 가질 수있는 누군가와 거기 기지 괜찮아 음, 고마워 [박수 갈채] [음악 재생]

Powering AI at Google Scale

[음악 재생] SUJITH RAVI : 모두 감사합니다 실제로 이곳에있는 것이 즐겁습니다

그래서 아침에 몇 가지 이야기를 들었습니다 너는 ML을하니, 나는 다시 가려고 노력하고있어 기본 조금 그 전에 마가렛이 말했듯이, 나는 연구 과학자이며 또한 리드 Google Research의 기계 학습 팀 몇 그건 내가 학업 모자를 쓰는 것을 의미한다 또한 제품 팀과 긴밀히 협력합니다

그 중 일부를 Google 제품에 대규모로 가져 오기 위해 노력하고 있습니다 그리고 당신을 지루하게하는 것보다 기법 중 몇 가지 예를 나눠 보겠습니다 몇 가지 문제를 해결하는 방법에 대해 일부 Google 제품에서 매일 사용하고 있습니다 그 연설의 제목은 Google Scale에서 AI Powering, 나는 깊은 학습과 그래프 학습을 말했다 우리가 따라갈 때 나는 그것의 포장을 풀 것이다

하지만 먼저, 내가 당신에게 동기를 부여하겠습니다 그래서 기계 학습은 많은 어플리케이션에서 사용됩니다 그러나 일에있는 기계 지능의 개념 언어 및 텍스트와 관련된 애플리케이션은 새로운 것이 아니며, 지난 5 년 동안 우리가 해낼 수 있었던 것 또는 우리가 할 수있는 일을 능가하는 것 같습니다 아마도, 이전에 그리고 이것은 주로 더 나은 모델, 더 나은 학습으로 인한 것입니다 기술 등 한 가지 예가 스마트 메시징입니다

당신 중 얼마나 많은 사람들이 조수들에 대해 들어 봤습니까? 내 말은, 당신의 구글 홈, 알렉사 흥미로운 응용 프로그램 중 하나 인 Google 전화를 사용하는 경우 스마트 답장에 대해 알고 있습니까? 따라서 Gmail을 사용하면서 아래쪽으로 스크롤하면, 몇 가지 제안 사항이 표시 될 수 있습니다 이는 수신 이메일에 대한 자동 회신과 같습니다 따라서 우리는 원래이 기능을 구축 한 팀의 일부입니다 그래서 나는 무슨 일이 일어 났는지에 대해 이야기 할 것입니다

그러나 이것은 핵심 기능 중 하나입니다 Gmail 및 다른 메시징 앱에서도 사용할 수 있습니다 그리고 우리가 해결하려고하는 근본적인 문제 사용자 대화의 의도를 어떻게 이해합니까? 그런 다음 어떻게 반응합니까? 어떻게 할 모델을 만들 수 있습니까? 많은 일이 잘못 될 수있는 여러 가지 방법이있을 수 있습니다 당신은 어떻게 그것을 저울에서합니까? 사용자 만족도에서 어떻게 할 수 있습니까? 당신이 단지 몇 가지 예언을 넣는 것이 아니라고 말하면서 사용자 앞 너는 실제로 그들에게 뭔가를주고있다

그들이 사용할 수있는 권리, 맞죠? 멋지다, 맞지? ML은 시원하게 들리지만, 하루가 끝나면 우리는 실제로 사용자를 만족시키기를 원합니다 그래서 이것은 많은 제품에서 시작되었습니다 Inbox, Gmail, Android Wear에서 가져 왔습니다 더 넓은 문제는 자연어 이해입니다 그래서 여기 아이디어는 마치 응답 만하는 것이 아니라, 하지만 실제로는 들어오는 문자열을 연결하려고합니다

예를 들어, 또는 보조 행동으로의 대화 이제 Google의 기능 중 하나 인 네가 말을 시작하면 타이핑을 시작하고, 나에게 뭔가를 상기 시키며, X는 X가 무엇이든 관계없이 실제로 몇 가지 조치를 제안합니다 예를 들어 엄마 한테 전화하라고 상기시켜주는 것처럼 Inbox를 사용하면 실제로 전화 걸기 아이콘이 표시됩니다 그리고 그것은 당신이 엄마를 연락처로 저장하게한다면, 실제로 전화 번호를 끌어 올 것입니다 따라서 한 번의 클릭으로 실제로 그 사람에게 전화 할 수 있습니다

이 예제의 수, how 당신은 이벤트에 참석하도록 상기시켜, 어떻게 가입 서비스 취소와 같은 일을합니까? 가입 서비스를 시작하십시오 그래서 여기에는 자연어 이해가 포함됩니다 규모로 그리고 문제는 여기에있는 것처럼 간단하지 않습니다 당신이하는 모델, 데이터를 얻는 것, 끝까지 훈련시키는 모델 그리고 나서 갑자기, 짜잔, 그것은 작동합니다

그런 식으로 작동하지 않습니다 언어에서 비전으로 이동 현재 Google 포토는 실제로 많은 개념을 이해할 수 있지만, 그래서 사진 보관함에서 해변을 검색하면 Google 포토가 실제로 끌어 올릴 것입니다 해변 사진, 개념으로 해변 위치 사진에 존재합니다 그리고 해변과 같은 것이 아닙니다

허니문 또는 추상적 인 개념을 검색하는 경우, 그것은 여전히 ​​인식 할 수 있습니다 그래서 우리는 실제로 이미지 이해가 필요합니다 그건 우리가 물건을 이해할 필요가 있다는 뜻이야 관계 같은 이미지 그 객체들 사이에서 규모면에서 매우 정확합니다 그리고 거기서 멈추지 않습니다

그래서 당신은 경험을 생각할 수 있습니다 단지 하나의 양식에 힘 입어 얻는 것이 아니라, 하지만 여러 가지 일을 할 수도 있습니다 이미지 인식을해야하는 곳 당신은 텍스트 이해 또는 사용자를해야합니다 이해와 이러한 모든 것들의 결합으로 힘을 얻는다 제품의 일부 기능

PhotoReply 우리가 만든 예제 그리고 그 생각은, 당신이 위에 이미지를 이런 식으로하면, 시스템이 실제로 자동으로 당신에게 줄 것이다 당신이 아기를 말하면, 그것은 말할 것이다, 귀여운, 클릭 한 번으로 응답 할 수 있습니다 그리고 이것은 자막이 아닙니다 자막은 이미지를 설명하려고한다는 것을 의미하기 때문입니다

이를 위해서는 이미지의 내용을 이해해야하며, 응답의 의도와 연관 지어 그것에 적합합니다 바닥과 마찬가지로 정말 멋지다 더 이상 할 수 있을지 모르겠다 하지만 동영상이나 스카이 다이빙 이미지를 볼 수 있다면 얼마나 흥미 진진하고 용감한지를 말하며 기본적으로 헤이, 스카이 다이빙을하는 사람 실제로 용감하다

우리는 바보도 추가해야하지만, 우리는 할 수 없다는 것을 알고 있습니다 그러나 당신은 그 아이디어를 얻었습니다, 그렇죠? 따라서 이미지의 개념에 응답하려고합니다 그리고이 모든 것들은 기계 학습을 필요로하지만, 그렇지 않습니다 단일 시스템이지만 여러 모델을 서로 다른 단계에서 사용할 수 있습니다 그리고 우리는 이것을 대규모로해야합니다

그래서 다른 많은 응용 프로그램이 있습니다 나는 이것에 대한 몇 가지 예를 들어 줄 것입니다 Smart Reply에 대해 이미 들었습니다 전자 우편 분류는 무언가이다 – 어떤 종류의 분류, 문서 분류 따라서 기계 학습 시스템과 같은 시스템을 구축해야합니다

이것은 깊은 학습을 포함 할 수도 있지만 또한 다른 시스템 학습 기술, 그래프 학습처럼 동일한 사용자의 이메일을 서로 어떻게 연결합니까? 그런 종류의 관계를 사용합니다 이러한 시스템을 구축해야합니다 많은 단어들이 있습니다 수년에 걸쳐 간행했다

그리고 이들 모두는 모두 생산에 사용됩니다 내가 말하지 않은 그들 중 하나는, 약 비디오 요약입니다 그리고 이것은 정말 멋진 프로젝트입니다 YouTube에서 한 시간짜리 YouTube 동영상을 상상해보세요 그것을 20 초짜리 gif로 압축합니다

따라서 조리법 및 물건과 같은 비디오를 검색하면 그런 식으로, 당신은 대부분의 시간에 사람이 50 분 동안 얘기하면 너는 10 분 만에 정말 재미있는 것들을 가지고있다 하지만 정확히 어디에서 발생하는지 알아내는 것은 매우 어렵습니다 그래서이 시스템은 실제로 기본적으로 섭취합니다 전체 비디오와 실제로 끈 가장 흥미로운 콘텐츠의 gif 좋아요, 그래서 이들은 아마도 당신에게 동기를 부여하는 몇 가지 예입니다

그리고 나는 당신에게 정말로 성공적인 것들을주고 있습니다 그것은 작은 아이디어에서 출발했지만 또한 Google 제품의 일부 핵심 문제를 해결할 수 있습니다 그러나 몇 가지 문제가 있습니다 그리고 이것들은 세 가지입니다 그러나 나는 이것이 매우 중요한 세 가지라고 생각합니다

ML이 멋진 모델을 구축하는 데 있다고 생각하는 사람이 몇 명입니까? 깊은 학습이나 그 밖의 고급 기술을 사용하고 있습니까? 네, 하나, 둘 나는 심지어 당신에게 그것을 깰 것이 싫다, 구글에서, 우리는 기계 학습의 최전선에 서 있습니다 데이터가 가장 큰 문제 또는 도전 과제입니다 그리고 만약 당신이 이것에주의를 기울이지 않는다면, 당신은 모든 종류의 물건을 할 수 있습니다 당신의 업무가 무엇과 비슷한가하면 그것은 효과가있을 것입니다

다른 사람들이 해냈습니다 그러나 나는 데이터에 매우주의를 기울여야한다고 말할 것이다 그리고 데이터와 관련된 여러 가지 문제가 있습니다 적절한 금액으로 어떻게 그것을 수집합니까? 시끄 럽든 싫든간에 올바른 유형의 데이터가 필요합니다 두 번째는 모델의 복잡성입니다

그럼 어떻게 생각하니? 작업을위한 모델을 구축하십시오 마치 단순한 모델처럼, 당신은 정말로 깊은 모델을 가지고 있습니까, 당신은 실제로 당신의 작업에 맞는 모델을 어떻게 고르 죠? 그런 다음 어떻게 한 장치를 좋아하는 것이 아니라, 하지만 수십억 개의 기기가 있습니다 특히 모바일 첫 번째 응용 프로그램? 이것에 또 다른 각도가 있습니다 다양한 유형의 계산 모델이 있습니다 따라서 우리는 클라우드에서 ML을해야 할 수도 있습니다

예측 만 제공한다면 클라우드에서 API를 사용하는 것처럼 모든 ML 구름 속에서 일어난다 그리고 모든 추론 또한 일어난다 구름에서 일어난다 그러나 Rishi 언급, 장치 ML에 들었을 때, 새로운 영역인데 점점 더 중요해질 것입니다 지역

다음과 같은 앱을 만드는 경우 그것에 대한 정보를 얻기 위해서, 장치 ML에 중요한 요소가 될 것입니다 그리고 그럼 당신은 알아 내야 만합니다 클라우드에서 구축 한 모델을 어떻게 가져 가야합니까? 이를 장치 모델로 변환 할 수 있습니까? 또는 종류의 두 가지의 조합을 가지고, 어떤 종류의 예측이있을 때 바로 당신은 실제로 장치에서 그렇게 할 수 있습니다 다른 경우에는 실제로 다시 위임 할 수 있습니다 구름에

자, 이제 이러한 과제 중 일부에 대해 알아 보겠습니다 감독 학습에 대해 얼마나 많이 알고 있습니까? 좋아, 거의 모든 사람 그렇지 않은 사람들을 위해, 언제 당신은 거의 배우면서 기계 학습을 듣습니다 모든 블로그, 모든 포럼 밖에서, 그들이 말하는 것은 감독이다 학습, 가장 자주하지 않습니다

그리고 그것이 의미하는 바는 기계 학습 모델을 구축하는 것입니다 우리는 실제로 레이블 데이터를 수집합니다 라벨 데이터의 개념은 귀하가 예기하려고하면, 이미지 분류를 해 봅시다 한 쌍의 이미지와 레이블을 모으고, 그 안에있는 물건과 같이 수천 또는 수백만 개를 생성 한 다음 모델을 만듭니다 그런 다음 당신은 그 예측을합니다

그 도전은 무엇입니까? 규모가 큰 응용 프로그램에서 작업하는 사용자의 경우 또는 비 일반적인 응용 프로그램 – 그건 거기에 몇 가지 틈새 의미 당신이 풀려고하는 것들 – 라벨 데이터를 얻는 것은 매우 어렵습니다 좋은 모델을 만들기에 충분한 양질의 라벨 데이터 그리고 그 경도는 많은 요인들에서 비롯됩니다 무엇보다도 먼저 누군가에게 돈을 지불해야합니다 실제로 작업에 필요한 데이터를 만듭니다

그것은 비싸다 또한 시간이 많이 걸립니다 그리고 그 데이터의 품질이 얼마나 좋은지에 따라, 당신의 모델은 빨거나 훌륭한 일을 할 수 있습니다 그래서 이것은 중요한 요소입니다 사람들은이 요소를 인식하지 못합니다

부 데이터는 실제로 가장 중요한 것입니다 너는 심지어주의를 기울여야한다 어떤 종류의 모델에 대해 생각하기 전에, 당신이 만들고 싶습니다 따라서 ML 세계에는 여러 가지 기술이 있습니다 이 문제를 해결합니다

나는 그것을 일종의 분류 체계로 분해 할 것입니다 어떻게 데이터 문제를 다루는가? 어떻게 기계 학습의 패러다임이 당신은 당신이 보거나 충분히 높은 품질을 가지고 있지 않은지 고려해보십시오

데이터, 라벨 데이터, 특히 대량의 데이터? 따라서 옵션 중 하나는 반 감독 학습입니다 그리고 그 아이디어는 당신이 어떤 라벨 데이터를 가지고 있다는 것입니다, 하지만 레이블이없는 데이터가 충분히 있습니다 그리고 둘 다 결합하려고합니다 실제로보다 견고한 모델을 만들 수 있습니다 레이블이없는 데이터의 기본 구조를 활용하십시오

무 감독 학습은 기본적으로 이전 이야기에서 들었던 것, 예측을하기위한 모델을 만들려고 노력합니다 대신, 당신은 어떤 표현을 배우려고합니다 데이터의 예를 들어, 내가 세계의 모든 이미지를 찍으면 그 (것)들을위한 몇몇 대표를 배우십시오, 그 이미지들을위한 일종의 임베딩처럼, 지금 나중에 어떤 분류를하고 싶다면, 대신 실제로 그 표현에서 시작할 수 있습니다 픽셀로부터 직접 시작하는 것 그럼 다른 건 – 아마도 당신은이 유행어를 들었을 것입니다

당신은 양도 학습, 소수 학습, 그리고 zero0shot 학습 완전히 새로운 개념을 배우고 싶다면 어떻게 될까요? 거기 누구도 그 모델을 만들지 못했습니다 그걸 수집 한 데이터? 완전히 새로운 개념입니다 그곳에서 무엇을 할 수 있습니까? 그래서 거의 촬영되지 않고 제로 – 샷 학습 그 문제를 다루는 것을 목표로한다 그리고 속임수는 당신이 당신의 개념을 연관 시키려고 시도하는 것입니다

몇 가지 알려진 개념 그리고 당신은 다른 개념들에 대한 라벨 데이터를 가지고 있을지도 모릅니다 너는 구조를 활용하려고 노력하고있어 이 레이블이 지정된 공간에서 그 정보 중 일부 그리고 전송 학습 설정에서, 당신은 이미 모델을 가지고 가고 있습니다

과제 A에 대해 사전 교육을받은 후 전송 B 작업의 도메인 그리고이 모든 기술들이 있습니다 이런 일을하는 방법에는 여러 가지가 있습니다 나는 세부 사항으로 들어가기 위하여려고하고 있지 않다, 그러나 만약 당신이 이것들을 듣고 당신 이게 뭐지? 사람들이 이러한 유행어를 사용할 때 어떤 이야기를하는지, 이것은 정확하게 그들이하려고하는 것입니다 이 모든 것들 사이에서 공통점이 무엇입니까? 우리는 데이터의 구조를 악용하려고합니다 또는 모형 공간에서 주어진 일에 어떤 효과가 있는지 알려줍니다

따라서이 모든 감독자가 아니거나 감독자 인 [INAUDIBLE] 레이블이 지정되지 않은 데이터를 가져 오는 것과 같이 설정합니다 구조를 악용하고,보고, 라벨 데이터를 어떻게 늘릴까요? 그 정보를 악용하려면? 여기 전형적인 그림과 같습니다 이미 동기 부여를 해 줬어 큰 문제는 당신이 가지고있는 말입니다 이미지 분류가 문제입니다

당신이 풀려고하는 것 라벨 데이터가 있지만 매우 제한적입니다 꽤 자주 레이블이없는 데이터가 많이 있습니다 그 말은, 인터넷으로 가져 가야 겠어, 그렇지? 세계의 모든 웹 사이트에있는 모든 문서 여기에는 흥미로운 정보가 포함되어 있습니다

아마도 모든 것이 당신의 과제와 관련이있는 것은 아닙니다 그러나 그것의 많은 것이 있습니다 이제 얼마나 많은 양의 레이블이없는 데이터를 사용합니까? 구축 할 라벨 데이터와 결합하십시오 꽤 좋은 모델, 견고한 모델? 이것은 솔루션 중 하나이며, 내 그룹 중 실제로 어떤 사람인가? 세미 감독 학습을 위해 해결책 우리는 이것을하는 기계 학습 플랫폼을 가지고 있습니다

그러나 이미지 분류에만 적용되는 것은 아닙니다 또는 언어 학습 또한 사기 탐지, 사용자 분류, 많은 응용 프로그램 그럼 언제 네가 이해해야하는지 ML 모델을 구축하는 것이 무엇처럼 보일지도 모릅니다 헤이, 아마도 이미지 클래스에 적합 할 것입니다

그러나 아이디어, ML을하는 방법에 대한 근본적인 생각, 필연적으로 모델 구조 그 자체, 아이디어는 새로운 작업으로 이전 될 수 있습니다 그래서 반 감독 학습에서, 우리가하는 것은 우리가 말했듯이, plentily 사용할 수있는 레이블이없는 데이터를 가져 가라 주석이 달린 데이터 인이 최소한의 감독 당신이 가지고있는 것입니다 사내 또는 도메인 전문가와 같은 일부 사용자는 그 구조를 악용하려고 노력하십시오 해당 구조를 악용하는 한 가지 방법 그래프 표현을 사용하는 것입니다

그리고 이것은 우리가 여러 가지 일을 할 수있게 해줍니다 무엇보다도 그래프를 선택하는 이유는 무엇입니까? 대표로, 맞지? 어떤 문제 나 ML 문제가 있다고 생각한다면, 인간이 실제로 말하기는 쉽다 저기, 여기 두 개의 물체 나 두 개의 데이터 포인트가 있습니다 나는 그들 사이의 관계를 정의 할 수있다 텍스트인지, 아니면 텍스트인지 여부 한 쌍의 이미지, 나에게 쉽다

그들 사이의 관계를 표현하기 위해, 그들이 유사하든 그렇지 않든간에, 말하는 것보다, 헤이, 이 개체는이 범주에 속해야합니다 따라서 Google의 지식 그래프를 생각해보십시오 우리는 엔티티가 서로 연결되어 있습니다 우리는 서로 연결된 많은 이미지를 가지고 있습니다 시작시 문제가 발생하면 이것을 지정하는 것이 쉬운 곳, 모든 데이터를 수집하는 것이 아니라 실제로 주석 달기 모든 데이터를 쉽게 지정할 수 있습니다

여기에 어떤 관계가 있다고 생각합니다 이 데이터 포인트가 서로 비슷하게 보입니다 그리고 이것들은 그렇지 않습니다, 그러면이 그래프 표현은 여러분에게 이를 이용하기위한 위대하고 강력한 메커니즘 그리고 그들은 모든 도전에서 벗어납니다 내가 언급 한 모든 것을 만드는 것 새로운 데이터에 주석을 달기

너를위한 구조를 포착하려하고있어 매우 매끄러운 방식으로 제공, 그런 다음 다운 스트림을 학습하는 기계에이를 사용하십시오 여기에 예제가 있습니다 이것은 이미지 그래프입니다 그래서 기본적으로 내가하려는 일 여기 가장자리와 노드의 그래프를 보여주고 있습니다

노드는 이미지입니다 가장자리는 시각적 유사성을 나타냅니다 이 이미지들 사이에, 맞아 이 두 종류의 자동차는 마치 동물처럼 보이는 것 같습니다 이 경우에는 차가 있습니다

교차 연결이있을 수 있습니다 다른 [INAUDIBLE] 사이 그러나 당신이 본다면, 우리는 이것을 반 감독자로지도 할 수 있습니다 이 패러다임을 전체적으로 말하면서 학습하십시오 4 개 더하기 3 개 – 7 개 이미지, 그러나 그들 모두에게 라벨을 붙이기보다는, 나는 그 이미지 중 하나에 레이블을 붙일 수있다

이 차는 사자입니다 이제이 그래프의 구조를 이용하면, 나는 실제로 확률 적으로 라벨을 붙일 수있다 자동차 나 사자의 가능성 이 그래프의 모든 이미지에 있습니다 이것이 우리가 악용하려는 아이디어입니다 그래서이 구조는 당신에게 일종의 유사한 개념을 부여합니다

기본 가정은 유사하다는 표시가 있어야한다 비슷한 것들, 비슷한 라벨들 그럼 우리가 어떻게해야합니까? Google에서는 확장기 ML 플랫폼을 사용하여이 작업을 수행합니다 그래서 많은 논문들이 있고 또한 이 일에 관한 블로그지만 기본적으로 Google의 모든 PA에서 거의 ML 제품을 지원합니다 그리고 이것은 규모로, 아마도 그렇지 않을 수도 있습니다

너에게 수십억 수조와 같이 재미있을거야 그러나 동일한 개념이 단일 기계에도 적용됩니다 단일 컴퓨터에서도이 작업을 실행할 수 있습니다 문제를 해결할 수 있습니다 그리고 문제를 두 가지 개념으로 나눌 수 있습니다

그래서 저는 그래프 학습에 관한 것입니다 첫 번째 방법은 데이터를 그래프로 변환하는 방법입니다 그리고 나서 두 번째는 일단 그래프가 생기면, 그걸 어떻게 배우나요? 따라서 그래프는 드문 것이 아닙니다 실제로 [INAUDIBLE] 가장 간단한 인스턴스는 소셜 그래프와 같습니다 또는 이미 액세스 권한이있는 사용자 그래프, 많은 경우에

사용자가 다른 사용자와 상호 작용하는 방식, 또는 기타 자산, 금융 기관 등 이를 구조로 정의 할 수 있습니다 실제로 그래프가 있습니다 처음부터 구성해야합니다 예를 들어, 이미지의 삽입 또는 표현

이러한 경우 실제로 이러한 표현을 사용할 수 있습니다 그런 다음 가장자리 쌍을 생성합니다 그래서 근본적으로, 내가 거기에서 차 이미지와 차를 보면 오른쪽 상단의 이미지, 내가 임베디드를 보면 그 둘 사이의 거리를 계산해라 embeddings, 그럼 나에게 일종의 제공 그 둘 사이의 유사성의 척도 열쇠는 다음과 같은 경우에 어떻게 할 수 있는가입니다

수억 개의 노드 또는 수십억 개의 노드가 있습니까? 오늘은 실제로 현실입니다 이 작업을 실제로 수행하는 것이 실제로 가능합니다 빠른 근사 알고리즘이 있기 때문에 그래프를 생성합니다 한 가지주의 할 점은 모든 에너지와 전산 자원을 소비하십시오 그것이 목표가 아니기 때문에 단지 그래프를 작성하는 것입니다

내 말은, 그것은 결국 수단이 될지도 모른다 그러나 그것은 최종 목표가 아닙니다 그래서 당신은 빠르고 근사한 방법을 생각해 내고 싶습니다 방법이 완벽하지 않더라도 괜찮습니다 그래서 당신은 실제로 뭔가하고 싶습니다

가장자리 쌍을 생성하는 데 매우 빠르고 효율적입니다 그리고 이것을하기위한 많은 기술들이 있습니다 자, 이것이 어떻게 보이는지 예를 들어 봅시다 그리고 이것은 장난감의 예입니다 내 말은, 우리는 실제로이 중 일부를 사용합니다

일부 대화식 작업의 경우, 감정 그래프를 만들고 싶다고합시다 어떤 단어 나 구절이 감정 개념을 나타내는 지 배웁니다 좋아요, 그래서 저는 단어와 구로 시작할 것입니다 내가 추출한 것, 말하자면, Twitter 또는 Messages 또는 당신이 가지고있는 응용 프로그램에 상관없이 이제 단어 삽입, 표현을 쉽게 찾을 수 있습니다

그 문구들 때문에 이미 오픈 소스에서 쉽게 사용할 수 있습니다 이것을 사용하여 이전 기술을 적용 할 것입니다 유사성 그래프를 생성하기 위해 언급 한 내용입니다 그래서 내장, 굉장하고 위대한에 기초하여 서로 강하게 연결되어있다 ROTFL과 하하가 서로 연결되어있다

비슷한 맥락에서 문장으로 나타나기 때문입니다 일단 내가 이것을 갖게되면 학습은 매우 유연해질 수 있습니다 재미있는 개념을 배우고 싶다면 이 그래프에서, 맞습니까? 웃음이라는 단어와 같은 단일 인스턴스에 레이블을 지정할 수 있습니다 나 한테 꽤 분명하기 때문에 그 웃음은 뭔가 재미 있어야한다고 제안합니다

그런 다음이 정보를 그래프를 통해 전파하십시오 비록 내가 본 적이 없지만 단어 ROTFL 또는 나는 그것이 무엇을 의미하는지 모른다 나는 이것이 동일한 라벨과 연관되어 있음을 알 수있다 여기에 핵심 아이디어가 있습니다 이것은

저는 방정식이 없다고 생각했습니다 슬라이드에 – 그러나 학습이 작동하는 방식은 – 사과 중간 상자를 무시하십시오

그러나 당신이하려는 것은 무엇입니까? 그래프를 만들면 10 억 조원이된다 가장자리 그래프, 그것이 무엇이든, 당신은 가지고 있습니다 레이블이 지정된 노드 중 일부와 레이블 이 y 모자로 표현됩니다 그래서 그것들은 사실 씨앗 노드들입니다 지상 진실

그리고 당신이하려는 것은이 정보를 전파하는 것입니다 그래프를 통해 그리고 그래프의 모든 다른 노드에 대해, 너는 배울려고 [INAUDIBLE] 배포는 괜찮습니까, 어떤 라벨에 속해야합니까? 고양이입니까, 개입니까?이 경우 재미 있습니까? 아닙니다 이것이 학습 과정이 시도하는 것입니다 학습 알고리즘이 실제로 작동하는 방법은 다음과 같습니다 그리고 그것은 꽤 직관적입니다

나는 그것에 대해 생각하고 싶다 상상한다 당신은 그래프 구조를 가지고 있습니다 빨강 및 주황색 색상을 예로 들어 보겠습니다 두 가지 개념, 두 가지 다른 개념, 나머지 노드를 배우려고합니다

그 개념의 속성은 무엇입니까 이 순간부터 시작해서 이 알고리즘에 대한 좋은 부분 그것들은 실제로 반복적입니까? 깊은 학습 모델을 구축 할 때와 마찬가지로, 당신은 한 번에 훈련을하지 않습니다 실제로 여러 반복을 실행 중입니다 그래서 당신이하는 일은 첫 번째 사례에서 전파하는 것입니다 빨간색 노드에 대한 자신감은이 노드에서 가장 높습니다

주황색은이 노드에서 가장 높으며 이것을 전파합니다 그 이웃에게 이제 이웃의 신뢰 변화 그것과 얼마나 밀접하게 관련되어 있는가 빨간색 또는 주황색 노드, 빨간색 대 오렌지 교대 개념의 속성 이전에는 단서가 없었습니다 지금은 아마 붉은 색이 될 가능성이 더 많다고합니다

그래서 같은 개념이 반복됩니다 그리고 더 멀리 갈수록 레이블이있는 노드에서 자신의 신뢰를 얻습니다 기본적으로 이전으로 돌아 가야합니다 즉, 전혀 가정을하지 말아야한다는 의미입니다 그래서 이것은 여러분이 사용하고있는 아이디어입니다

학습 과정에서 그리고 앞의 예제를 사용하면, 정확히 무슨 일이 일어난거야 따라서 첫 번째 노드에는 자동차라는 레이블이 붙어 있습니다 그것은 자동차 이미지와 강하게 연결되어 있습니다 그래서 전파 할 때 자신감 자동차 컨셉 이미지 증가하고 그래프를 따라 이동할 때 그것은 일종의 감소입니다 여기에 더 많은 연결이 없으면, 그것을 원래 노드에 연결합니다

100 개의 예문, 1,000 개의 예제가 있으면이 기능이 유용합니다 네가 가진다면 어떻게 될지, 말하자 수십억 개의 노드와 수조의 가장자리? 그것은 그 규모가 아닐 수도 있습니다 심지어 100,000 일 수도 있습니다 모든 것을 메모리에로드하고 싶지는 않습니다

컴퓨터에서 이러한 작업을 수행하십시오 좋은 부분은 실제로 배포 할 수 있다는 것입니다 그래서 당신은 같은 머신에 그것을 배포 할 수 있습니다 또는 다른 기계에 걸쳐 따라서 전체 그래프에는 같은 기계에 앉기

그리고 다른 것들도 있습니다 우리는 그것이 무엇을 위해서 작동하도록해야만 하는가? 분류가 아닌 것을 예측하려고하는 경우에 발생합니다 문제 기본적으로 당신은 개처럼 예측하려고합니다 아닙니다

그리고 대신에 당신은 예측을하려고합니다 레이블의 풍부한 공간 즉 백만 개의 우주 라벨이라고합시다 수백만 개가 넘는 라벨을 예측해야하는 이유는 무엇입니까? 주어진 개념의 예측 여부를 예측하려고한다고 상상해보십시오 A가 발생하고 또 다른 개념 B가 발생합니다

그래서 개념의 조합입니다 따라서 사용자는 사기이며 – 너희들에게 더 좋은 생각이있어 그 다른 것들은 그러나 상상해보십시오 당신은 작곡 라벨을 예측하려고합니다 이제 라벨 수를 볼 수 있습니다 기하 급수적으로 증가합니다 그래서 일정한 시간에 그것을 처리 할 수있는 방법이 있습니다

그래서 이것은 우리의 출판물에서 나온 것입니다 그래서이 모든 것들,이 모든 문제들에 대해 생각하는 방법 너는 작게 시작하고 싶다 가장 간단한 문제의 인스턴스, 그리고 나서 그것을 천천히 스케일 업하십시오 그것은 데이터 스케일링인가, 데이터, 그래프, 또는 출력 복잡성의 스케일링 (scaling) 아니면 모델의 복잡성 문제입니까? 여기보다는 반복으로 생각하십시오 이 작업을위한 가장 좋은 모델은 내 데이터에 적용 해보십시오

왜냐하면 당신이 점진적으로 그렇게한다면 실제로 방법을 생각해 볼 수도 있습니다 그것은 당신의 작업을 위해 밖에있는 것보다 훨씬 낫습니다 그리고 이것은 꽤 많이 일어납니다 좋아, 그래서 나는 그래프 학습에 대해 이야기했다 어떻게 우리가 이것을 대규모로 할 수 있을까요? 따라서 이것이 데이터의 구조를 악용하는 한 가지 방법이며, 또한이 [미숙 한]

에서 벗어나십시오 나는 많은 질문이 떠오르는 것을 들었다 데이터를 얻는 방법, 새 도메인, 충분한 데이터 또는 고품질 데이터가 없습니다 그래서 이것이 그 구조를 이용하는 한 방법입니다

그러나 당신의 업무가 어떤 예측을 포함한다면 꽤 자주 어려운 문제, 고용량 모델 필요 그 스펙트럼의 끝에 이는 당신이 깊은 학습을해야한다는 것을 의미합니다 또는 심지어 다른 유형의 ML 모델도 있습니다 그래서 당신은 그래프를하지 않습니다 제 말은, 당신이 단지 그래프 그 자체로 학습을하십시오

실제로 한 번에 할 수 있습니다 모든 주석을 배우고, 모든 높은 내용을 선택하십시오 노드라고 말하면서 이제는 모든 사용자에 대해 알았습니다 [INAUDIBLE] 확률 X 또는 1 – X 그렇지 않은 경우 그러나 실제로 그 위에 구축 할 수 있습니다

따라서 이것을 심층 학습 모델과 결합 할 수도 있습니다 그래서 내가 어떻게하는지에 관해 알아 차리기 전에, 왜 우리가 실제로이 모델을 사용하는지 생각하면, 내가 말했듯이, 그래프 학습은 얻을 수있는 데이터의 일부 구조 데이터 또는 다른 문제에 대해 깊은 학습 및 기타 ML 모델 기본적으로 일부 예측 기능을 배우려고합니다 일부 입력에서 출력으로 이동합니다 그들은 특히 깊이 배우고 있습니다 신경망은 매우 훌륭한 기능 예측 자입니다

몇 가지 예를 들어 봅시다 이 두 가지는 cahoots에서 작동합니다 특히 Google 규모 스마트 답장은 그 완벽한 예입니다 그래서 우리가 처음 이것을 소개했을 때, 우리는 방법을 상세히 설명한 논문을 가지고 있습니다

그러나 나는 너에게 약간의 감각을 줄 것이다 왜 두 사람이 필요한지 따라서이 애플리케이션에서는 특히, 목표는 들어오는 대화를 듣는 것입니다 응답을 예측해야합니다 아마도 그럴 가능성이 높거나 좋은 것입니다

원래 보낸 사람에게 보냅니다 그리고 당신은 그들에게 여러 제안을 보여주고 싶습니다 여기서 그래프 학습은 압축하기 위해 사용됩니다 수백만 달러를 투자하면 세계에서 수십억 개의 메시지, 그것들을 어떻게 반응과 텍스트로 묶을 수 있습니까? 감사하다는 말은 1,001 가지가 될 수 있습니다 Thx, dot dot dot, 느낌표, 가능한 모든 변형

내 말은, 당신은 수동으로 라벨을 붙일 필요가 없다는 것입니다 그리고 이봐 요,이게 실제로 이 덕분에 고마워요

실제로는 같은 것을 의미합니다 그래서 이것이 그래프 학습이 시작되는 곳입니다 그래서 우리는 메시지를 통해 그래프를 만들고 관련 문구를 읽은 다음 학습을하고 무엇을하는지 모든 메시지를 수백 가지의 응답 의도로 매핑합니다 그리고 이것들은 해석 가능한 응답 의도입니다 우리가 실제로 말할 수있는 것처럼, 이봐, 고마워한다면, 특정 유형의 컨텐츠에 속합니다

그리고 나서, 시퀀스 모델 인 깊은 네트워크는, RNN이나 LSDM에 익숙하다면, 그래서 그것이하는 일은 대화에서 오는 것입니다 이 대화를 인코딩 한 다음 응답을 선택하려고 시도합니다 그러나 우리가 실제로 발견 한 그러한 의도 중 하나에서 그래프 학습 단계에서 여기에 한 가지 예가 있습니다 그래서 이것은 질의입니다, 안녕하세요

우리가 앉아서 채팅하기를 바랍니다 나는 화요일과 수요일에 자유 롭다 그리고 기계에 의해 생성 된 응답은 실제로, 나는 화요일에 할 수있다, 나는 수요일에 할 수있다 화요일 어때? 화요일에 할 수있어 아마 ML 시스템에서는 꽤 좋은 것처럼 보입니다

아무도 저에게 뭐가 잘못 됐는지 말해 줄 수는 없지만, 또는 이러한 모든 제안을 표시하면 문제가 될 수 있습니다 사용자에게? 관객 : [INAUDIBLE] SUJITH RAVI : 예, 그렇습니다 그러면 어떻게 처리 할 수 ​​있죠? 그래서 지금 당신이 그 반응들을 보면, 다른 메시지에 대해 내일 회의에 참석할 수 있습니까? 다시 동일한 문제가 나타납니다 그러나 대신에, 당신이 예측을 보면 우리는 이미 응답 의도를 이해했습니다 우리는 실제로 다양성을 강요 할 수 있습니다

그래서 이것은 당신이 필요로하는 것입니다 따라서 항상 최고의 성능을 발휘하는 단일 ML 시스템이 아닙니다 산출 실제로 사용자 만족도를 높이기 위해 우리는 실제로 결합해야 할 수도 있습니다 다른 기계 학습 패러다임, 다른 기계 학습 시스템

그래서이 경우 처음 두 개는 다른 의도, 또는 적어도 약간 다른 의도, 이 것이 다른 반면, 더 부정적인 것의 종류 인 반면, 나는 그것을 할 수 없다 그러나 다른 모든 것들은 그것들 중 하나에 실제로 들어갑니다 그래서 우리는 세 가지 가장 다양한 것들을 보여줄 것입니다 따라서 이것은 인코딩되어 있으므로 기본적으로 그래프 학습을 사용하여 의미 적 의도를 배우려고 노력하는 것 깊은 학습 따라서 이미지 분류에서도 같은 결과가 나타납니다

Google 포토를 사용하는 경우 모두 사물의 마지막 몇 세대 Google 포토에서 사용되는 인식 모델 또한 클라우드에서 실제로 이러한 두 시스템을 모두 사용합니다 그리고 여기서 문제는 약간 다릅니다 다양성을위한 것이 아닙니다 우리가 실제로 고품질을 구축해야한다면 동일한 품질의 Google 포토 용 시스템 네가 지금보고있는 시간, 얼마나 많은 시간이야 당신이 만약 우리가 접근 할 수있는 모든 이미지에 라벨을 붙이는 것이 었습니까? 관객 : [INAUDIBLE] SUJITH RAVI : 10,000 건, 꽤 비관적입니다

[INAUDIBLE]하지만 저는 우리가 수십 년 안에 그것을 할 수 있다고 생각합니다 아마 그때, 또한, 신 구글도 다른 것으로 옮겼을 거라는 걸 안다 그때까지 그래서 우리가하는 일은 수억 억에 달하는 것입니다 이미지의, 그러나 단지 작은 조각, 때로는 반 퍼센트가 라벨링되어 있다고 가정 해 봅시다

그래서 우리는 실제로 세미 감독 학습을 사용합니다 깊은 학습 방법과 결합 차세대 시스템을 구축 할 수 있습니다 그리고 여기 열쇠는 당신이 이것을하고 있기 때문입니다 깊은 학습 시스템은 훨씬 더 효율적으로 학습합니다 당신이 모든 시끄러운 것을 보여주지 않기 때문에 중복되고 쓸모없는 이미지

내 말은, 당신은 실제로 고품질의 데이터 포인트를 제공한다는 것입니다 그래서 그것은 더 빠르게 훈련 할뿐만 아니라 품질도 향상시킵니다 훨씬 더 좋다 사진 답장과 동일합니다 Photo Reply 시스템의 1 세대, 그리고 거기에서, 당신은 목표가 있다고 생각할 수 있습니다, 그냥 이 예제를 다시 표시하려면 이미지가 있어야합니다

당신은 기본적으로 응답하기를 원합니다 졸업 사진이 당신을 의미한다고 해봅시다 축하해 그래프 학습 문제의 한 사례 기본적으로 이미지 공간에 개념이 있습니다 그러나 당신은 또한 응답을 가지고 있습니다

지금 나는 모르고있다, 그들은 모두 linguine 또는 파스타 심상이고, 하지만 나는 그 linguine이 맛있어 야해 그래서이 그래프를 통해이 정보를 전달할 수 있습니다 그리고 이봐, 링구인이 관련되어야한다고 배웁니다 맛있는 응답 음, 이는 데이터에서 보는 것에 달려 있습니다

그래서 어떤 사람들은 링가인을 좋아하지 않는다면, 당신도 그것을 볼 수 있습니다 그러나 아이디어는 당신이이 개념들을 어떻게 배우는가입니다 구조화 된 방식으로? 동영상 요약에 대해서도 마찬가지입니다 나는 이것이 정말로 멋진 예라고 생각한다 우리는 인턴 중 한 명에게이 일을 맡겼습니다

데모는 정말 멋있었습니다 나는 당신에게 데모를 보여줄 수 있었으면 좋겠다 다음은 예제 중 하나입니다 연어 파스타 요리 비디오와 같은 질문을 받았습니다 YouTube에서 한 시간 정도의 결과를 얻을 수 있습니다

요리 비디오 그리고 그 사람이 말하는 대부분의 시간, 아마 요리 부분과 관련이 없을 지 모르지? 그들의 개인적인 삶에 대해서 이제 정보를 실제로 추출하고 싶다고 상상해보십시오 좋아, 나는 가장 관련있는 개념에 관심이있다 또는 당신이 저에게 20 초의 비디오를 보여 주면, 전체 비디오를 요약 할 수 있습니까? 그러나 입력은 단순한 비디오가 아니지만, 예를 들어, 연어 파스타 또는 무언가와 같은 일부 콘텐츠 그런 식으로

그래서 그것은 두 가지 모두를 결합한 것입니다 [INAUDIBLE] 학습을 통해 비디오를 프레임으로 나눕니다 깊은 계획을 사용하여 프레임이 처리됩니다 시스템을 사용하여 표현을 작성한 다음 당신은이 프레임들 위에 그래프 구조를 만든다 어느 것이 중복되는지 보려면 그래프를 그 위에 학습

그리고 전체 과정의 끝에서 다른 프레임 또는 세그먼트를 선택하고 있습니다 컨셉과 가장 관련이있는 비디오에서, 뿐만 아니라 다양합니다 그리고 나서 그것을 일종의 완벽한 방식으로 함께 묶습니다 GIF처럼 연주 그래, 비디오는 – 그는 Night Rider의 팬 이었으므로 DeLorean을 가졌습니다

흥미로운 모든 비디오가 요약되어 있습니다 이러한 것들의 전체 캐시 하지만 이것은 복잡한 문제라는 생각을줍니다 그러나 구조를 실제로 활용하는 방법이 있습니다 그리고 이것은 끔찍한 것처럼 보입니다

상상해보십시오 주석 시스템을 구축해야하는 경우 전 세계의 모든 동영상을 가져 와서 실제로 선택 프레임을 작성하고 요약을 작성하십시오 절대 일하지 않을 것입니다 그래서이 같은 기술이 필요합니다 실제로 새로운 애플리케이션을 구축 할 수 있습니다

잘하면이게 당신에게 동기를 부여합니다 우리가 어떻게 이러한 기계 지능 기능을 대규모로 구축하는지 우리가 확장 성을 어떻게 다룰 지, 및 데이터 문제 그래서 두 가지 개념, 즉 깊은 학습, 그래프 학습에 관해 이야기했습니다 이제 어떤 시스템이라도 ML을 만들거나 만들지 않으면, 당신은 몇몇 구성 요소를 구축하는 것으로 시작합니다 그런 다음 다른 구성 요소를 만들기 시작합니다

그 위에 그리고 나서 어느 시점에, 당신은 이 두 가지 구성 요소를 사용하는 것은 실제로 비효율적입니다 별도로 실행하십시오 너 아마 끝내기 쉬운 방식으로이 작업을 수행하려고합니다 그래서 이것은 신경 이식 학습의 개념입니다

또한 우리가 ML에서 힘을 얻고있는 새로운 연구 분야이기도합니다 커뮤니티,하지만 그 아이디어는 괜찮습니다 깊은 학습에 이어 그래프 학습을해야하고, 그런 다음 한 번에 할 수 있습니까? 그래서 우리가 이렇게하는 방법 중 하나 우리가 신경 그래프 기계라고 부르는 것입니다 그래서 이것에 대한 논문이 있고 실제로 사용하고 있습니다 많은 응용 분야에 사용됩니다

그러나 당신은 이것을 대신 생각할 수 있습니다 픽셀 또는 기능을 신경 네트워크에 공급하는 것, 이제 그래프 또는 구조를 피드 할 수 있습니다 그 사용자 그래프를 찍은 다음 신경 네트워크에 그 먹이주기 흥미로운 것을 배울 것을 요구합니다 그래서 이것이 여기의 아이디어입니다 나는 우리가 어떻게 이런 일을하는지 자세히 설명하지 않을 것이다

ML 모델을 훈련 할 때 당신은 생각할 수 있습니다 최적화 또는 정의하려고합니다 일종의 손실 함수와 시도 이를 향해 최적화하십시오 여기서 손실 함수에는 두 가지 구성 요소가 있습니다 기본적으로 하나는 좋은 예측자를 배웁니다

예를 들어 픽셀을 클래스로, 두 번째는 실제로 그래프 구조를 존중하십시오 즉, 당신이 말해주는 것들이 그래프에서 비슷하다는 것을 의미합니다 구조는 유사한 표현을 배워야한다 신경망 내부의 중간 층 내부에 그래서 우리는 그것이 아주 멋지다 고 생각합니다 그래프의 두 커뮤니티를 실제로 연결한다고 생각합니다

학습과 깊은 학습 그래서 지금 당장이나 이걸 사용해야합니까? 우리는 정보를 융합하는 자연스러운 방법이라고 생각합니다 새로운 응용 프로그램을 강화하십시오 좋은 부분은 어떤 아키텍처에 의존하지 않는다는 것입니다 신경망 구조를 취하면, 그것은 기본적으로 모든 사람들과 작동합니다

목적 함수로보다는 매개 변수화 네트워크의 구조 따라서 피드 포워드 버전을 사용할 수 있습니다 당신은 또한 이것을하는 컨볼 루션 모델을 가질 수 있습니다 이미지 그래프가있는 경우, 컨벌루션 네트워크를 사용하여 실제로 처리 할 수 ​​있습니다 이 목적 함수

당신은 이것의 신축성있는 버전을 가질 수 있습니다 우리는이 모든 변종을 다 만들었습니다 그리고 그들은 실제로 꽤 좋은 개선을합니다 이것이 실제로 도움이되는 몇 가지 응용 프로그램이 있습니다 그래서 우리는 그것을 사회적 그래프를 예측하는 데 사용했습니다

예를 들어 사용자 그래프가 있습니다 실제로 몇 가지 특성을 예측하려고합니다 그 사용자들에게 당신은 실제로 그것을 먹일 수 있고 얻을 수 있습니다 꽤 좋은 예측

이제 그래프를 그릴 수있는 또 다른 방법이 있습니다 그런 다음 사용자에 대해 알기 위해 노력하십시오 속성을 그래프 구조를 사용하여 만듭니다 즉, 그래프를 의미합니다 그리고 나서 그래프를 완성 시키면, 그런 다음 기존 ML에 적용하면 SVM 또는 깊은 네트워크

그것은 접근법입니다 이것은 기본적으로 단일 샷으로 시도합니다 텍스트 분류, 문서 분류, 의미 론적 이해, 이해 의도, 그리고 낮은 감독 그건 내가 너에게 말한 감정 문제를 의미한다 어디서 새로운 개념을 배우고 싶은지, 이 모든 것이 여기에 가능합니다

이제 중요한 점은 흥미로운 결과 중 하나입니다 대부분의 사람들이 그것이 가장 복잡하다고 생각한다는 것이 었습니다 실제로 항상 생성되는 가장 큰 네트워크 최고의 성능 우리가 보여 주었던 것은 이러한 작업의 일부에 대한 것이 었습니다 예를 들어, [INAUDIBLE]에 익숙하다면 —- 얼마나 많은 사람이 [INAUDIBLE]을 알고 계십니까 ?? 따라서 캐릭터 CNN 모델에 익숙하다면 소개, 그들은이 9 층처럼 성능 변수가 그 깊이의 3 분의 2를 사용하게하려면 동일한 성능을 얻을 수 있습니다

어떤 경우에는 더 나은 성능을 제공합니다 그래서 아이디어는 데이터의 구조를 악용합니다 신경망이든 ML 모델이든 상관없이, 실제로 성능을 향상시키는 데 도움이 될 수 있습니다 이를 수행하는 데는 여러 가지 방법이 있습니다 이것은 그들 중 하나입니다

좋아, 마지막 부분은 우리가 얘기 했어 데이터의 문제점 해결, 모델의 복잡성, 다양한 유형의 ML을 어떻게 결합합니까? 패러다임, 이것에 또 다른 각도 그것은 다른 계산 모델이 될 수도 있습니다 클라우드에서 최상의 시스템을 갖추고있을 것입니다 그러나 실제로 그것을 제공하고 싶을 때 웨어러블이나 심지어 휴대 전화와 같은 기기에서 매우 까다로울 수 있습니다 특히, 이 깊은 네트워크 모델에 매우 만족 그런 다음 알아 내야 만합니다

좋아, 시계 나 휴대 전화에서 어떻게 실행합니까? 그리고 내가 왜 그렇게하고 싶어하는지 말해 줄께 어떤 경우에는 그렇지 않습니다 실제로 만들 대역폭이 충분하다면 구름 예측 또는 구름 호출, 나는 이것이 당신이 선택해야 할 첫 번째 선택이라고 생각합니다 기기 내 설정은 여러 설정에서 유용합니다 그게 옵션이 아니야

하지만 실제로 많은 경우에 클라우드 컴퓨팅과 온 – 디바이스 컴퓨팅을 모두 수행 할 수 있습니다 기기 기반 ML에 대해 들었는데, 적어도 일부는 Google에서 Rishi의 노력에 대해 그래서 저는 리시가 언급 한 노력 중 일부를 이끌고 있습니다 우리가 시작한 질문 중 하나는 이것은 2 년 전이었습니다 스마트 회신 문제를 해결하십시오 Android Wear 팀이 우리에게 와서 물었습니다

당신은 똑똑한 응답을하기를위한이 중대한 모형이있다 시계에 그걸 만들 수 있을까요? 그리고 우리는 공연 무관심한 모델들에 대해서 이야기하고 있습니다 그 시계를 보여주는 750 메가 헤르츠를 가지고 있고 아마도 그렇지 않습니다 그 추억의 10 분의 1도 그럼 우리가 어떻게해야합니까? 그 이유는 – 우선, 그러한 응용 프로그램을 구축하려는 동기 꽤 분명하다, 그렇지? 시계 나 휴대 전화가 항상 켜져 있습니다

따라서 예측 모델에 실제로 액세스하면 그리고 그것은 매우 쉽습니다 – 내 말은, 혼잡 한 환경에서 유용하게 쓰일 수 있습니다 실제로 설정하지 않은 설정 랩톱을 들고 응답을 보내고 싶습니다 버튼 하나만 누르면, 당신은 상상할 수 있습니다 실제로 답장을 보냅니다 그래서 우리가 해결하려고하는 일반적인 문제는 – 나는 추론 부분에 집중한다

내가 얻을 수있는 훈련 그래서 당신은 약간의 의견을 받았고 당신은 ML 모델이 모든 예측을 직접 만들길 원한다 장치에 장치는 시계, 휴대 전화, IoT, Raspberry Pi, 센서, 의료 기기 등 그 이유는 온 – 디바이스 ML을 수행 할 때 여러 가지 이유가 있습니다

신청서에 따라 일부 또는 전혀 적용되지 않을 수 있습니다 연결성은 꽤 흔합니다 그래서 당신이 신흥 시장에 있다면, 항상 Wi-Fi 또는 강력한 Wi-Fi에 액세스하지 못할 수 있습니다 이것이 실제로 ML 온 디바이스를 수행하는 한 가지 이유입니다 개인 정보는 매우 중요합니다

모든 사용자가 데이터를 클라우드로 스트리밍하려는 것은 아니지만, 많은 경우 솔직히 말해서 필요하지 않습니다 실제로 좋은 예측을 할 수 있다면 휴대 전화 나 기기에서 좋은 경험을 쌓고, 그게 사실이야 그것이 그들이 관심을 갖는 것입니다 그리고 당신도 그로부터 이익을 얻을 수 있습니다 모든 데이터를 스트리밍하고 페이로드를 가져 오는 것보다 물류 등을 저장합니다

그리고 마지막으로, 효율성 그래서 그들은 RPC 호출을하고 있습니다 돌아 오는 등, 그것은 번거 로움이됩니다 자, 물론, 이것은 말하기가 더 쉽습니다 많은 어려움이 있습니다

나는 그들 중 몇 가지를 여기에 열거했다 하드웨어는 분명 하나입니다 귀하의 휴대 전화는 아마 덜 강력하고 느린 것입니다 노트북보다 랩톱 컴퓨터보다 강력하지 않습니다, 서버 전체 데이터 센터보다 강력하지는 않습니다 따라서 계산이 변경되는 규모를 볼 수 있습니다

빠르게 그렇다면이 모델을 어떻게 구축하고 계산을할까요? 주어진 하드웨어 제약 조건? 둘째, 기기에서 ML을 수행하거나 수행하고 싶지 않습니다 나쁜 경험으로 이어집니다 기기를 사용하고 있기 때문에 당신이나 우리 중 누구에게도 말할 권리를주지 않습니다 헤이, 그래,이게 우리가 할 수있는 일이야

내 말은, 사용자는 내가 상관하지 않는다고 말할 것이다 더 나은 모델을 생각해 내십시오 셋째, 실제로는 더 까다 롭습니다 복잡한 모델을 만들고 결합 그것들은 서버보다 장치에 있습니다 서버에서는 구성 요소를 교체하는 것과 같습니다 그리고 그것은 모두 개발자에게 추상화되어 있습니다

그러나 당신이 회사로서, 당신이 이것들을 만들 때, 테스트하기가 더 어렵고 힘들어집니다 서로 다른 시스템을 결합 할 수 있습니다 그리고 작업이 더 복잡해지면 더 어려워집니다 일부 라벨인지 여부를 예측하거나 미안합니다 액션 X를하고 있거나 한 가지는 아닙니다

응답과 같이 더 부유 한 것을 예측하고, 약간 더 도전적입니다 어떻게 이런 일을합니까? 그래서 관심이 있다면, 당신은 볼 수 있습니다 우리 일의 일부에서 블로그에 자세한 내용이 있습니다 그러나 첫 번째 시장에서 할 수있는 것은 무엇인가? 실제로 작년에이 기능을 출시했습니다

Android Wear에서 그래서 기본적으로 시스템은 API가 어떤 마모 개발자를 위해 추상화 된, 당신은 그것에 꽂고 대화를 통과 할 수 있습니다 그리고 다음을 사용하여 일련의 응답을 받게됩니다 ML 시스템 우리가 어떻게하는지에 관심이 있다면, 열쇠는 우리가 가지고있는 것입니다 보다 효율적인 운영과 아키텍처를 제시한다

이 복잡한 모델 LSTM이 무엇을하는지 시뮬레이션 할 수 있습니다 이를 수행하는 데는 여러 가지 방법이 있습니다 우리가 가진 것은 새로운 방법입니다 투영 기반의 신경망입니다 언어에 익숙하거나 깊은 네트워크 언어 [INAUDIBLE] 첫 번째 레이어는 기본적으로 일부 단어 임베딩을로드합니다

또는 단어 표현 이제 거대한 행렬입니다 그걸 저장해야합니다 그 주위에 방법이 없습니다 이것은 기본적으로 그 문제에서 벗어납니다

동적으로 계산할 수 있다고 말합니다 나는 그 말을 많이하지 않는다는 것을 압니다 그러나 관심이 있다면 나중에 물어보십시오 그리고 멋진 부분은이 아주 작은 네트워크를 얻는 것입니다 거의 100 ~ 1,000 x 더 작습니다

그리고 공연은 아마도 부부 일 것입니다 원래 모델과 다른 백분율 포인트 정말 멋지다 더 좋게,이 기능은 모든 Android Wear에서 사용할 수 있습니다 메시징 앱 그래서 당신이 큰 회사이든, 작은 회사이든, Android Wear 앱 또는 휴대 전화 앱이있는 경우, 실제로 API에 연결할 수 있습니다 무료로 예측을하십시오

이것이 Google 연구에서 구축 한 방법 중 하나입니다 우리는 실제로 그것을 오픈 소스로 시도합니다 코드 또는 논문을 통해, 또는 원활한 API TensorFlow Lite 버전도 있습니다 이것의 오픈 소스에서 사용할 수있는, Android Wear, 가지고있는 기기가 아니어도됩니다

이 모델에 연결할 수 있습니다 마지막으로 Smart Reply에 신경 쓰지 않는다면, 하지만 자신의 앱을 위해이 일을하는 것에 신경을 써야합니다 네가하는 특정 작업이 있다고 가정 해 보겠습니다 관심있는 사용자 정의 장치 모델을 만들 수 있습니다 Learn2Compress 프레임 워크를 사용하여이 작업을 수행 할 수 있습니다

그 [불충 한] 언급했다 우리는이 기초를 만들었습니다 지금은 몇 가지 유스 케이스를 지원합니다 알파에 관심이 있으시면 가입하시기 바랍니다 그리고 아이디어는 데이터 및 / 또는 기존 데이터를 업로드 할 수 있다는 것입니다

단일 모델 또는 단일 모델 또는 모든 모델이 압축되고 효율적입니다 즉, 속도가 빨라지고, 전력 효율이 높으며, 또한 메모리 측면에서 더 작습니다 그리고 이것은 Firebase 용 Google ML 키트를 통해 사용할 수 있습니다 따라서 Android와 iOS에서 모두 작동합니다 관심이 있으시면 확인해주십시오

그래서 그걸로 내가 닫을거야 시간 내 주셔서 감사 드리며 질문이 있으시면 언제든지 기쁘게 생각합니다 [박수 갈채] [음악 재생]

Training Image & Text Classification Models Faster with TPUs on Cloud ML Engine (Cloud AI Huddle)

[음악 재생] LAK LAKSHMANAN : 그래서 나는 무엇을 이야기 할 것인가? 이미지 및 텍스트 모델, 분류 모델, TPU, Tensor 처리 장치, Google Cloud에서 주로 ML 엔진을 사용합니다 우리의 관리 인프라 플랫폼입니다

그러나 TPU에 직접 연결할 수있는 방법을 보여줄 것입니다 Jupyter 노트북에서 그리고 거기에서도 직접 물건을 실행할 수 있습니다 그렇다면 TPU는 정확히 무엇입니까? 따라서 TPU는 기본적으로 하드웨어 가속기입니다 대부분 내 생각에 모든 경력은 소프트웨어를 다뤘습니다

그러나 하드웨어는 이런 종류의 멋진 기능입니다 기본적으로 TPUs로 작업하는 것은 재미있었습니다 TPUs의 핵심은 대부분의 프로세서와 달리 모두 익숙한, 이것은 범용 소프트웨어가 아닙니다 권리 CPU를 생각할 때 GPU를 생각해보십시오

이것들은 일반적인 목적입니다 기본적으로 GPU에서 그래픽을 만들 수 있습니다 GPU에서 렌더링을 할 수 있습니다 이제 게임을 할 수 있습니다 비트 코닝 마이닝을 할 수 있습니다

GPU에서 다양한 작업을 수행 할 수 있습니다 TPU, 기계 학습에서 할 수있는 유일한 방법이 있습니다 그래서 그것은 ASIC입니다 응용 프로그램 특정 칩입니다 특정 작업을위한 것입니다

그러나 그것이 당신에게 가져 오는 것은 그것이 가장 빠른 하드웨어라는 것입니다 거기에 기계 학습을 위해 그래서이 벤치 마크가 있습니다 스탠포드 (Stanford)가 운영하는 DAWN 벤치마킹 기본적으로 TPU는 이미지의 원하는 정확도는 93 %입니다

그리고 그것에 도달하는데 얼마나 걸리나요? 그리고 그것은 기본적으로 30 분 이내에 도달합니다 기본적으로 여기서 이야기 할 내용은 이미지 및 텍스트 모델에 대해 이야기하겠습니다 사람들이 훈련하는 주요 종류의 모델, TPU를 사용하여 자신의 데이터에서이 작업을 수행하는 방법에 대해 설명합니다 그래서 나는 마침내이 마지막 물건에 대해서 이야기 할 것입니다 당신이 커스텀 모델을 작성했다면, 어떻게하면 TPU를 실행할 수 있도록 적응시킬 수 있을까요? TPU를하는 이유에 대해 이야기하겠습니다

그들과 함께 개발하는 방법, 그리고 최첨단 이미지 모델에 대해 이야기하고, 최첨단 텍스트 모델 그리고 Puneith가 소개에서 말했다시피, 사람들이 할 수있을 때 정말 흥분해 어떤 코드도 쓰거나 글을 쓰지 않고 최소한의 양의 코드 최첨단 모델에 관한 두 부분 어떻게 당신이 뭔가를 할 수 있는지에 대한 것입니다 그것은 최첨단입니다

기본적으로 사용하십시오 마지막으로 맞춤 모델에 대해 이야기하겠습니다 그리고 주문형 모델은 괴짜들을위한 것이다 아니 나는 내 자신을 쓰고 싶다

나는 그것을 실제로하고 싶다 그리고 우리는 그것에 대해서도 이야기 할 것입니다 그래서 우선, 왜 TPUs입니까? 왜 우리는 주문형 ASIC 칩을 개발하고 개발할 것인가? 그리고 우리는 이미 그것의 3 세대가 있습니다 권리? 적어도 우리는 배 회사가 아닙니다

권리 왜 우리가 신경을 쓰는가? 그리고 그것은 기본적으로 몇 가지로 내려갑니다 AI 개발 관점에서 흥미 롭습니다 첫 번째는이 그래프는 기본적으로 데이터 크기가 오류율에 미치는 영향을 보여줍니다 그리고 이것은 여러 가지 다른 문제에 공통적입니다

이 특정 그래프는 자연어를 보여줍니다 그러나 당신이 이미지를 찍든, 당신은 시계열을 가지고, 당신은 텍스트를 취하고, 그래프는 매우 비슷하게 보입니다 숫자는 다르지만 그래프 모양 매우 비슷해 보입니다 그럼이게 뭐야? 이것이 오류율입니다 데이터의 크기가 커짐에 따라 오류율이 떨어집니다

괜찮아 벌금 그러나 방울을 보자 그것은 선형입니다 권리

오류율은 선형 적으로 떨어지고 있습니다 그러나 데이터에 어떤 현상이 발생 했습니까? 여기에 x 축은 무엇입니까? 정확하게 지수 권리 이 그리드 라인과이 그리드 라인 사이에서, 데이터에 어떤 변화가 있습니까? 배가

권리 따라서 오류율이 조금씩 감소 할 때마다 우리가 깊은 학습을 위해 많은 자료가 필요하다고 말할 때, 무슨 소리 야? 우리는 두 번, 네 번, 여덟 번, 32 배 많은 데이터 우리는 10 % 더 많은 데이터를 말하는 것이 아닙니다 우리는 더 많은 데이터를 말하고 있습니다 이것이 첫 번째 그래프입니다

두 번째 그래프는 전년 대비입니다 AlexNet은 기본적으로 시작했습니다 8 개의 레이어로 전체 깊은 학습 아이디어 이제는 많은 계산이 필요하다는 것을 알고 있습니까? 그것은 어느 정도의 계산입니다 Google의 자동 ML입니다

그래서 기본적으로 진행되고 있습니다 강화 학습을 사용하는 적절한 모델을 위해 이것이 필요한 컴퓨팅의 양입니다 그리고 나서 Alpha Go는 그보다 훨씬 높습니다 다시 한번 말하면, 이것은 매년입니다

그리고 이것은 필요한 계산량입니다 그리고 계산 결과는 어떻게됩니까? 10 번이나 갈거야 권리 1 년 내내 꽤 많이 따라서 두 그래프를 합치면, 이제 우리는 약 30 만 배나 더 많이 필요하다는 것을 알게되었습니다

우리가 몇 년 전에 필요했던 것보다 계산하십시오 승인 그래서 그것은 우리를 얼굴로 바라 보는 큰 것입니다 우리는 엄청난 양의 계산이 필요합니다 더 나은 정확성을 얻을 수 있습니다

정확도가 더 중요합니다 권리 우리 모두가 전화를 사용하는 이유 정확도가 떨어 졌기 때문입니다 특정 임계 값 이하 임계 값 아래로 떨어질 때까지, 그것은 충분하지 못했습니다

우리는 실제로 그것을 제품에 내장 할 수 없었습니다 이제 우리가 할 수 있습니다 그리고 우리가이 모델들을 훈련하는 것이 매우 중요합니다 그리고 우리는 우리의 전문 용어를 사용하여 데이터를 훈련시킵니다 우리 업계의 전문 용어 등으로 따라서 Jeff Dean은 Google의 AI 수석과 같습니다

그래서 2014 년에 그는 봉투 계산을 되풀이했습니다 모든 사람들이 자신의 전화를 3 대라고 말하면 사용 가능한 모든 컴퓨팅 리소스가 소진됩니다 행성에 그럼 어떻게 하시겠습니까? 당신은 TPU를 개발합니다 권리

그래서 기본적으로 할 일은 무어의 법칙이 언제 우리를 구할거야? 물론 전년 대비 컴퓨팅 성능은 계속 상승하고 있습니다 그리고 이들은 모두 다른 혁명입니다 코어의 수를 계산할 때 일어날 것입니다 다른 힘, 등등 그리고 짧게 긴 이야기, 그것은 밝혀진다

거의 모든 것이 2010 년경에 고원 상태로 시작되었습니다 그래서 무어의 법칙은 우리를 구할 수 없습니다 우리는 더 많은 계산이 필요합니다 그러나 무어의 법칙은 우리를 구할 수 없습니다 권리

그래서 이것이 근본적으로 지금의 이유입니다 범용 프로세서는 잊어 버려 개발해야 할 무언가가 필요하다면, 종종 충분하다면 개발을 시작하십시오 2015 년 Jeff Dean이 돌아온 지 1 년 후 엔벨로프 계산 중 TPU 버전 1이 필요했습니다 그리고 그의 계산이 무엇인지 기억하십시오

근본적으로 모두가 그들의 전화로 말한다 그래서 그는 무엇에 대해 걱정 했습니까? 그는 훈련에 대해 걱정 했습니까? 추론이 걱정 되니? 추론 그래서 TPU 버전 1은 추측에 관한 것입니다 기본적으로 우리 훈련 된 모델들 기본적으로 모든 사용자의 부하를 처리 할 수 ​​있습니다 기본적으로 그것을 사용합니다

권리 예측 훈련은 스스로 돌볼 수 있다고 생각했습니다 추측을 해봅시다 그래서 그것은 TPU 버전 1이었습니다

버전 2 이상에서는 교육과 추론을 모두 수행합니다 그리고 현재 알파에있는 버전 3입니다 권리 우리가 개발 한 이들 모두는, ASIC 칩에 관한 것들 중 하나 지금 당신은 많은 투자를해야합니다 그것을 개발

그래서 우리가 기본적으로 열어 볼 인센티브가 많이 있습니다 다른 사람들이 사용하는 방법, Google 방식 기업 사용자를 위해 Google Cloud를 통해 열려 있습니다 그렇다면 TPU는 무엇입니까? 이것은 기본적으로 TPU가 어떻게 생겼는지를 보여주는 도식입니다 기본적으로 칩 당 2 개의 코어가 있습니다 그리고 각 코어는 기본적으로 행렬 곱셈 유닛을 포함합니다

그것이 그 핵심입니다 또한 스칼라 및 벡터 단위를 포함합니다 나는 그것들에 대해서 이야기 할 것이다 또한 약 8GB의 메모리가 들어 있습니다 나는 TPU 버전 2에 대해 말하고있다

버전 3에는 더 많은 메모리가 있습니다 32GB가 있습니다 하지만 버전 2에는 8GB의 메모리가 있습니다 코어 당, 더 큰 계획에서, 작은 것처럼 보입니다 권리

왜 8GB의 메모리만으로 칩을 만들겠습니까? 그러나이 핵심에 관한 것이 아니라는 것이 밝혀졌습니다 그것은 기본적으로 얼마나 많은 사람들이 모일 수 있는지에 관한 것입니다 그래서 칩당, 당신은 기본적으로, 지금, 코어 당 기본적으로 이러한 모든 것들이 있습니다 또한 약 8GB 메모리 코어가 있습니다 TPU 당 4 개의 칩

각 칩에는 두 개의 코어가 있습니다 그래서 총 8 개의 코어가 있습니다 이 TPU 보드 중 하지만이 TPU 보드를 가져 가면, 당신은 그것들을 랙에 모아 놓습니다 권리

이것이 바로 우리가 포드 (pod)라고 부르는 것입니다 포드에는 64TPU가 있습니다 그리고 각 TPU에는 4 개의 칩이 있으며 2 개의 코어가 있습니다 기본적으로 전원이 공급되고 있습니다 그래서 큰

따라서 포드 당 64TPU가 있습니다 그리고 행렬 곱셈은 모든 힘 들어 온다 아이디어는 기계 학습을 살펴 보는 것입니다 그리고 기계 학습의 전부는 무엇입니까? 본질적으로 선형 대수학, 행렬 곱셈입니다 따라서 여러분은 매우 빠른 매트릭스 곱셈을하는 시스템을 구축 할 수 있습니다

그 밖의 것은 없습니다 그리고 그것은 기본적으로 TPU 뒤에있는 아이디어입니다 행렬 곱셈을 실제로, 정말로, 정말로 빠르게 수행하십시오 그래서 아이디어는 기본적으로 많은 힘과 밀도를 포장하는 것입니다 왜냐하면 다른 어떤 것도 할 필요가 없기 때문입니다

행렬 곱셈뿐입니다 그리고 우리가 그렇게 할 수 있다면 아이디어는 고정 된 기능이라는 것입니다 건축물 그리고 만약 당신이 CPU를 생각한다면 스칼라 수학, 벡터 수학을하는 GPU, TPU는 Tensor 수학을하고 있습니다 권리

그리고 그것은 행렬과 행렬에만 초점을 맞추고 있습니다 곱셈 이것의 두 번째 부분은 모든 칩들, 그들은 개인이 아닙니다 그들은 모두 매우 빠른 토 로이드 메쉬로 연결됩니다 이것이 본질적으로 의미하는 바는 하나의 단위로 기능 할 수 있습니다

그래서 당신은 실제로 하나의 핵심을 다루는 것이 아닙니다 사실 당신은 모두 함께 치료하고 있습니다 그래서 훌륭합니다 그러나 그것이 실제로 의미하는 것은 당신이 증가함에 따라 코어 수, 이미지 수 처리 또는 처리중인 텍스트 수 선형으로 자랍니다 이것은 아주, 아주, 아주 어려운 그래프입니다

우린 모두 그걸 잘 알고 있습니다 권리? 코드를 배포합니다 귀하의 코드는 어떻게됩니까? 선형으로 확장되지 않습니다 권리 속도가 느려집니다

하나만 사용하면 가장 빠릅니다 TPU와 함께 하나가 포드라는 생각 당신이 꼬투리 안에있는 한 그것은 똑같은 속도입니다 기본적으로 고속 인터커넥트를 사용하고 있습니다 그래서 당신은 꽤 스케일링을 얻고 있습니다

코어의 수는 선형이다 관객 : 클럭 속도는 걱정하지 않아도됩니다 특징 크기로? 네 LAKSHMANAN : 네 그래서 우리가 염려하는 모든 것들

그리고 그것들은 최적화되어 있습니다 그러나 모든 칩이이를 최적화하고 있습니다 핵심 아이디어는 여기에 초점을 맞추고 있습니다 행렬 곱셈에 그리고 우리는이 일이 이 물건이 비늘 있도록 네트워킹에 집중하라

선형으로 Google의 철학이라고 생각합니다 권리? 한 대의 기계에서하지 마십시오 여러 컴퓨터에서 해보십시오 그들을 밖으로 확장하십시오

그리고 숫자를 통해 척도를 얻습니다 그것은 전체지도의 동일한 철학입니다 계산에 적용된 모든 아이디어를 줄입니다 관객 : ASIC에서 어떤 기능을 제공합니까? 크기 [INAUDIBLE]이 (가) 내장되어 있습니까? 그리고 사용하는 클럭 속도는 무엇입니까? LAK LAKSHMANAN : 클럭 속도가 무엇인지 전혀 알지 못합니다 나는 소프트웨어 녀석이다

[LAUGHS] 나는 TPUs에서 벗어날 수있는 것에 매우 관심이 있습니다 나는 알아낼 수있다 우리가 그들을 풀어 주더라도 나는 모른다 우리가한다면, 나는 당신을 찾을 수 있습니다 예

관객 : 얻을 수있는 최대 포드는 무엇이며, [INAUDIBLE] ?? 아, 그거야? 포드에는 64 개의 TPU가 있습니다 승인 최대 64 개까지 갈 수 있습니다 여러 개의 광고 모음을 가져올 수도 있습니다 그러나 그 시점에서 선형성이 무너지기 시작합니다

권리 당신이 꼬투리 안에 있으면, 기본적으로 이 놀라운 네트워크를 얻는 것 두 번째 포드가 있으면 더 이상 그렇지 않습니다 관객 : [INAUDIBLE] 네 LAKSHMANAN : 네

청중 : 그것은 매우 중요합니다 기능 크기 [INAUDIBLE]에 사용하는 코드 수 그것은 권력과 당신이 어떻게 꾸릴 수 있을지를 정의합니다 맞아 관객 : 매우 중요한 매개 변수입니다 OK

LAKSHMMAN : 알겠습니다 승인 시원한 그래서 우리는 TPU를 가지고 있습니다 이것이 우리가 TPU를 개발 한 이유입니다

TPU로 어떻게 발전합니까? 권리 이제는 기본적으로 소프트웨어 측면입니다 먼저 TPU를 개발하고 있습니다 TPU를 가지고 있으면 도움이됩니다 방금 컴퓨터에 연결되었습니다

TPU를 컴퓨터에 어떻게 연결합니까? Google Cloud에 이미 있습니다 그래서 당신이하는 일은 기본적으로 Google Cloud에서 가상 시스템을 시작하십시오 그리고 그 가상 머신은 Google의 뒤에 연결됩니다 TPU에 방화벽 기본적으로 클라우드 TPU를 갖게됩니다

그리고 당신은 그것에 연결하고 있습니다 그리고 기본적으로 당신이하는 일은 CTPU 나 클라우드 TPU를 얻는 것입니다 쪽으로 따라서 Cloud Shell에 있거나 실제로 CTPU 프로그램을 다운로드하면 설치할 수 있습니다 당신은 기본적으로 CTPU를 할 수 있고, TPU의 이름을 붙일 수 있습니다

그런 다음 로컬 컴퓨터에서 당신은 기본적으로 SSH를 클라우드 TPU에 포트 포워딩을 통해 수행합니다 기본적으로 포트 8888을 로컬 컴퓨터에 포트 포워딩합니다 그러면 Jupyter를 포트 8888로 시작합니다 사실 TPU에 연결되어 있습니다 권리

그걸 내가 주피터 노트북에서 TPU에서 실행될 것입니다 그것은 기본적으로 아이디어입니다 아니면 TPU에서 뭔가를 실행할 수 있습니다 어떻게 작동합니까? 그래서 제가 한 것은 수업을 시작하기 직전이었습니다 나는 앞서 가서 기본적으로 CTPU를했다

그리고 나는 Jupyter를 시작했다 그러니 그냥 Jupyter를 해보 죠 그리고이 시점에서 저는 로컬 호스트 8888을하고 있습니다 그리고 나는 이제 Jupyter 노트북을 가지고있다 그리고 터미널을 시작하겠습니다

그리고 내가 터미널 안에서 무엇을 할거야 내가 나의 repo의 힘내 복제품을 할 것이라는 점이다 Google Cloud Platform 교육 데이터 분석가 괜찮아 그래서 Git이 복제되었습니다

그리고 나는 여기로 돌아갈 수있다 그리고 레포가 나타났습니다 그리고 내가 그 노트를 끌어 당기게 해줘 TPU 그래서 이것은 GitHub에 있습니다

그래서 TPU의 기본 이제는 노트북이 있습니다 이제이 노트북을 실행할 때, 이 CPU 또는이 VM에서 실행 중입니다 CPU에 연결됩니다 그래서 대부분의 것들은 VM에서 일어나고 있습니다

하지만 제가 말한다면,이 기능을 TPU에서 실행하십시오 그 기능은 TPU에서 실행됩니다 그래서 제가하고있는 첫 번째 일은 제 TPU의 이름입니다 LakTPU였습니다 그래서 나는 이것을 할 것이다

그리고 그것은 미국 중앙 C에있었습니다 내가 그렇게한다면 – 어떻게 된 거예요? 데모 신들 승인 이 일은 아직 진행 중입니다 왜 아직도 그래? 그것을 다시로드하십시오

승인 그곳에 훨씬 낫다 승인 그러니 그걸 실행합시다

오 나는 이것을 바꿀 필요가있다 TPU가 없다고합니다 그래서 다시 실행하면 거기에 있습니다 그래서 내가 한 첫 번째 일은 이 이름을 가진 TPU를 찾으십시오

이 기계에 부착되어 있습니다 이제 TPU를 발견했습니다 그래서이 시점에서 저는 TPU를 가지고 있습니다 그래서 우리는 기능이 있다고 말하고, 매우 멋진 기능 x 및 y를 추가하고 싶습니다

그래서 나는 기능을 가지고있다 나는 그 기능을 가지고있다 그리고 보통은 x와 y를 더합니다 하지만 여기서 내가 할 일은 내가 말하자면, 계속해서 add 함수를 호출하여 x와 y에서 그 함수를 실행하고 그 함수를 TPU에서 실행합니다 파이썬 함수가있는 한 기본적으로 TPU는 다시 작성해야한다고 말합니다

내 기능은 다음과 같습니다 이것들은 필요한 인수입니다 나를 위해 그것을 실행합니다 그리고이 기능은 TPU에서 실행됩니다 그래서 그것은 본질적으로 어떤 프로그래밍인가? TPU는 기본적으로 다음과 같은 몇 가지 함수를 작성합니다

기본적으로 완료 될 것입니다 그래서 그것은 TPU 추가입니다 TensorFlow가 어떻게 작동하는지 알고 있다면, 그 그래프를 만들었습니다 그리고 그것을 실행하고 싶다면 TPU를 초기화합니다 그런 다음 TPU 추가를 실행하십시오

그리고 x와 y를 더한 결과를 얻어야합니다 권리 x는 기본적으로 0에서 15까지의 숫자입니다 그리고 그것들을 추가하고 있습니다 그래서 1에서 17까지의 숫자를 얻습니다

1에서 16까지입니다 x는 0에서 15까지입니다 그래서 나는 1에서 16을 얻는다 예 관객 : 이것은 또한 독수리 모드 [INAUDIBLE] ,,에서 실행되어야합니다

권리? LAK LAKSHMANAN : 이것은 Eagle 모드에서도 실행됩니다 옳은 당신은 지금 독수리 모드를 할 수 있습니다 그러나 Eagle 모드는 더 어렵게 만듭니다 TPU 재 작성을 원하기 때문입니다

이렇게하면 더 쉽게 할 수 있습니다 그래프를 만듭니다 그래프를 다시 작성하십시오 그런 다음 그래프를 실행하십시오 예

관객 : 그것은 Tensor일까요? 매개 변수는 Tensor 여야합니까? LAK LAKSHMANAN : 매개 변수는 Tensors 여야합니다 옳은 그들은 Tensors 여야합니다 그리고 나는 또한 이야기 ​​할 것입니다, 이상적으로이 Tensors는 거대합니다 그리고 그들은 기본적으로 128 정도의 크기를 가지고 있습니다

다시 말하면, 그것은 고정 함수입니다 그것에 대한 최적의 행동입니다 그래서 당신이 가지고있는 한, 그것은 본질적으로 그것입니다 이제 우리는 이것을 가져 와서 그것은 함께 조금 더 재미있는 것으로 합쳐집니다 제가 여기서하고있는 일은 제가 원하는 것입니다

기본적으로 MNIST 데이터를 얻으려면 Hello World, 기본적으로 두 개의 NumPy 배열을 만듭니다 이것이 기본적으로 제가이 단계에서하고있는 것입니다 이제 데이터를 다운로드하고 있습니다 그리고 그것을 얻었고, 나는 x 열차와 y 시험을 가지고있다 그리고 나서 나는 내 적합성, 내 적합성 및 열차를 수행하는 기능을 가지고 있습니다

기능 내가하고있는 일은 내가 들어가는 이미지를 찍는거야 기본적으로 그것을 밖으로 평평하게합니다 나는 78x 어레이를 만드는 MNIST에서 28×28 이미지를 가지고있다 그리고 나서 여기에 변수 인 내 가중치를 가져 가라

또 다른 변수 인 내 편견을 가지고, 그리고 나서 매우 멋진 로지스틱 회귀 모델을 만들었습니다 그래서 x 시간 w 플러스 b 권리 그게 내 모델이야 그리고 내 손실

이것이 여러분이해야 할 한 가지 변화입니다 그래서 내 손실은 일반적으로 크로스 엔트로피에 의한 것입니다 그리고 내 옵티마이 저는 기본적으로 손실을 최적화합니다 원자 최적화기를 사용할 수 있습니다 하지만 원자 최적화기를 직접 사용하지는 않는다

당신이하는 일은 그 원자 최적화기를 가져가는 것입니다, 크로스 샤드 옵티마이 저 (cross shard optimizer) 라 불리는 것으로 이것을 마무리합니다 내가 TPU에 대해 말한 것은 기본적으로 선형 적으로 비례한다 코어 수는? 크로스 샤드 옵티 마이저는 그 일을합니다 권리 따라서 하나의 핵심을 최적화하는 대신, 그것은 들어올 이미지들의이 배치를 취할 것입니다

얼마나 많은 사람들에게 퍼뜨릴 것인가? 당신이 가지고있는 핵심 그리고 각 코어는이 최적화를 수행 할 것입니다 배치의 일부로 그리고 장벽이 있습니다 모든 것이 장벽에 부딪칩니다 모든 그라디언트가 평균화됩니다

그리고 나서 다음 단계로 넘어갑니다 따라서 크로스 샤드 옵티 마이저는 일반적으로 한 가지 변경 사항입니다 기본적으로 활용하기 위해 코드를 작성해야합니다 이 선형 스케일링의 그래서 우리는 이렇게하고, 그러면 우리가 말하기를, 좋아, 나는 원한다 계속해서 그것을 최적화하십시오

그래서이 시점에서, 우리는 기본적으로 말할 수 있습니다, 다섯 번째 일괄 처리 기능을 사용하여 다시 작성하겠습니다 TPU는 다섯 번째 배치 기능을 다시 작성합니다 그래서 내 원래 함수는 CPU 또는 GPU에서 실행됩니다 TPU에서 실행할 수 있도록 다시 작성하십시오 그리고 그것을 한 걸음 씩 달아 라

실제로 50 단계를 실행합니다 50의 범위 승인 그리고 당신은 기본적으로 당신의 손실을 얻습니다 그래서 꽤 많이 있습니다

따라서 반복 개발을 할 수 있습니다 TPU가 컴퓨터에 연결되어 있어야합니다 그리고 너는 주피터 노트북을 쓰고있어 GPU를 사용하여 실행중인 작업에 익숙한 방식, 그것은 매우 유사합니다 단, 당신은 이제 능력을 가질 것입니다

이 제품을 정말 빠른 하드웨어로 확장하려면, 처리 속도가 매우 빠릅니다 예 관객 : Atom 옆의 옵티 마이저 중 어느 것 지원됩니까? LAK LAKSHMANAN : Atom 외에 어떤 옵티 마이저가 지원됩니까? 거의 모두 권리 몇 가지가있을 수 있습니다 – 자신의 최적화 도구를 사용할 수도 있습니다

그리고 당신은 그들을 감쌀 수 있습니다 그러나 우리는이 시점에 도달하고 있습니다 TensorFlow의 거의 모든 항목이 지원됩니다 지원되지 않는 작업 목록이 있습니다 그러나 첫 번째 근사치로 가정합니다

그리고 그렇지 않다면, 아가씨처럼 예 청중 :이 인터페이스는 TensorFlow 2로 이동 하시겠습니까? LAK LAKSHMANAN :이 인터페이스가 바뀔까요? 이것은 TFcontribTPU입니다

그래 그것은 바뀔 것입니다 예 그러나 근본적으로 그것이 작동하는 방식은 모든 것이 시작된다는 것입니다 기여하다

API와 모든 것이 정확합니다 그리고 나서 그것을 접습니다 이 특정 API는 내가 생각하는 것보다 많이 변하지 않을 것입니다 그것은 하나의 함수를 다시 작성한 것입니다 하지만 나중에 내가 너에게 어떻게 얘기하는지 이 상급 수준의 견적을하기 위해, 그것은 크게 바뀔 것입니다

그 아이디어는 상자 밖에서, 우리는 우리의 평가자가 실제로 TPU에서 작업하기를 원합니다 코드를 변경하지 않아도됩니다 오늘날 TPU가 새롭고 하드웨어가 출시되기 때문에, 그래서 당신이 평가자를 쓰는 과정이 있습니다 코드를 수정해야합니다 크로스 샤드 최적화 도구를 추가해야합니다

그 종류의 것들 그러나 우리는 그것이 자동적 인 지점에 도달하기를 원합니다 TPU에서 뛰십시오 그리고이 그래프 수정은 해당 장치에서만 발생합니다 일어날 전에

권리 이것이 우리의 최종 목표입니다 우리는 거기에 가고 싶습니다 하지만 지금 당장 거기에 도착할 때까지, 이것들은 우리가 변경 한 몇 가지 사항입니다 하지만 내가 말하고자하는 것은 그것이 이 마법의 일

이러한 변경 사항은 매우 미약합니다 근본적으로 크로스 샤드 최적화 도구를 사용하고 있습니다 그리고 당신이 쓰고 싶은이 기능을 사용하고 있습니다 그것을 TPU로 다시 쓰는 것을 말합니다 그리고 그게 다야

예 관객 : Keras에서 TPUs를 사용할 수 있습니까? Kerak와 함께 TPUs를 사용할 수 있습니까? 예 권리 전혀 예

Keras와 함께 TPUs를 사용할 수 있습니다 그리고 모델 함수는 TensorFlow 함수 일 수 있습니다 Keras 기능을 포함합니다 하지만 당신은 당신의 인풋과 아웃풋을 사용하지 않습니다 나는 그것들에 대해서 이야기 할 것이다

TPU는 단 한 가지 일을한다는 것을 기억하십시오 한 가지 일을 잘합니다 그것은 수학입니다 그래서 당신은 그 수학이 Keras에 쓴다 Keras 및 TensorFlow, 작동합니다

관객 : Keras [INAUDIBLE]로 변환해야합니까? LAK LAKSHMANAN : 케르사를 개조 할 필요가 없습니다 모델을 TF 레이어에 추가합니다 아니 그냥 작동합니다 예

관객 : [INAUDIBLE] LAK LAKSHMANAN : 아닙니다 현재 없습니다 예 네

예 관객 : 열렬한 사형 집행은 어떨까요? 열망하는 처형은 어떨까요? 따라서 이것이 로드맵에있는 것 중 하나입니다 그것은 우리가 지원할 수 있기를 원하는 것입니다 그러나 지금 바로이 재 작성 단계가 있습니다 그래서 그걸로는 효과가 없습니다

그러나 아이디어는 당신이 열망하는 마음으로 발전한다는 것입니다 기본적으로 제작 시간에는 TPU에서 실행합니다 아마 그것에 대해 생각할 수있는 더 받아 들일 수있는 방법 일 것입니다 그리고 그것은 당신의 훈련입니다 그리고 다시, 우리는 예측 기능을 가지고 있습니다

그리고 그것은 단지 전통적인 기능입니다 그리고 그것을 TPU에서 실행하고, TPU가 그것을 다시 작성하기를 원합니다 그래서, 다시 똑같은 그렇게함으로써, 그것은 기본적으로 예측을 할 것입니다 그리고 당신은 당신의 예측을 계획 할 수 있습니다

오, 매트 플롯을 설치하지 않았습니다 신경 쓰지 마 승인 그래서 그것은 데모였습니다 권리

이것이 내가 실행하고있는 노트북에 대한 링크입니다 승인 그래서 본질적으로 그 단계를 따르십시오, 기본적으로 노트북을 실행합니다 그리고 Jupyter에서 실행할 수 있습니다 그래서 모든 데모는 이미 GitHub에 있습니다

그래서 당신은 그들을 밖으로 시도 할 수 있어야합니다 승인 그래서 멋있었습니다 그래서 처음부터 TPU를 개발하는 방법을 보여주었습니다 기본적으로 TensorFlow 함수가 있습니다

몇 가지, 당신은 단지 그것을 실행하고 싶습니다 그러나 이제 조금 더 높은 단계로 나아 갑시다 예술 이미지 모델의 상태를 원한다고 가정 해 봅시다 권리 글쎄, 우리는 그것을 쓸 수있다

그러나 우리는 왜 그것을 쓰고 있습니까? Resonant 50이 주위에 있습니다 Resonant 50을 가지고 그것을 실행할 수 있습니까? 그래서 다양한 참조 모델이 있습니다 클라우드 TPU에 사용할 수 있습니다 그래서 당신이 이미지 인식을 생각하고 있다면, 당신은 기본적으로 당신의 Resonant 50 101, 200, 등등을 가지고 있습니다 사용할 수있는 다양한 Resonant 모델이 있습니다

AmoebaNet은 실제로 매우 흥미로운 선택입니다 AmoebaNet은 신경 구조 검색입니다 ImageNet에서 수행해야하는 제약 조건과 함께 TPU에서 매우 빠르게 훈련하십시오 권리 그래서 빠릅니다

정확합니다 그리고 매우 큰 데이터 세트에 대해 교육을 받았습니다 그래서 AmoebaNet은 당신이 말하면 꽤 좋은 선택입니다, 나는 이미지 인식을하고 싶다 그러나 Resonant는 더 많은 사람들이 잘 알고있는 것입니다 그래서 나는 당신에게 공명 (Resonant)을 보여줄 것입니다

그것들은 모두 매우 유사하게 작동합니다 따라서 객체 감지에 관심이 있다면, RetinaNet, 달리기에 관심이 있다면 전화, MobileNet 또는 기계 번역, 나는 변압기 모델에 대해 이야기 할 것이다 이들 모두는 변압기 기반입니다 그때 나는 당신에게 훈련의 예를 보여줄 것입니다 너 자신의 문제에 뭔가있어

그리고 이러한 음성 인식, 이미지 생성, 이러한 참조 모델이 더 있습니다 그 모든 시간이 다가오고 있습니다 모두이 GitHub 레포에 있습니다 그래서 당신이 나아가 예술 모델의 상태를 원한다면, 그게 모두있어 그럼 어떻게 예술 수준을 취하는 지 살펴 보겠습니다

모델을 만들고 자신의 데이터로 실행하면됩니다 그래서 제가 골라 내야 할 것은 Resonant 50입니다 그래서 Resonant 50을 훈련시키고 싶다고합시다 그리고 그것은 기본적으로 DAWN Benchmark의 최상위에있었습니다 그리고 제가 방금 이야기 한 Repo에 있습니다, TensorFlow / TPU

그리고 모델의 공식 공명이 있습니다 그래서 그것이 그것을 실행하는 모델입니다 그래서 제일 먼저하는 일, 어떻게 운영합니까? 내가 너에게 보여준 것은 기본적으로 Compute Engine에서 TPU를 시작합니다 이는 개발 목적으로 유용합니다 데스크톱 컴퓨터에 TPU를 연결하려고합니다

그래서 당신은 기본적으로 당신이 개발하는 동안 물건을 실행할 수 있습니다 그러나 지금 나는 내 큰 데이터에 Resonant 50을 훈련시키고 싶다 그것은 더 이상 발전하지 않습니다 그것은 지금 생산입니다 그리고 생산을 위해, 당신은 뭔가를 원합니다

그것은 완전히 관리됩니다 아이디어는 직업을 제출하는 것입니다 그리고 ML 엔진은 TPU를 시작하고, 모든 것을 훈련 시키며, TPU를 종료합니다 권리 따라서 전체 라이프 사이클을 붕괴시키고, 당신 스스로 시작하고 멈출 필요가 없습니다

그래서 당신이해야 할 일은 언제입니까? 기본적으로 규모를 조정하는 직업을 시작합니다 따라서 확장 된 계층은 기본 TPU입니다 기본적으로 기본 계층을 지정하십시오 당신이 Kubernetes를 할 수도 있습니다 기본적으로 모든 것을 제어하는 ​​데 관심이 있습니다

그래서 당신은 Kubeflow와 함께 Kubernetes 것을 가질 수 있습니다 그리고 당신은 Kubernetes 무리의 일환으로 TPUs 가질 수 있습니다 나는 그것에 대해 이야기하지 않을 것이다 데모 번호 2 따라서 기본적으로 Resonant를 교육하거나 배포하려고합니다

ML 엔진을 사용하여 내 자신의 데이터에 그래서 여기의 링크는 기본적으로 나를 코드 랩으로 안내합니다 얼마나 많은 사람들이 코드 랩에 익숙합니까? 기본적으로 당신이하는 일련의 지시들입니다 그것을 수행하는 방법을 기본적으로 알려주십시오 그래서 첫 번째는 기본적으로 설정하는 것입니다

우리 주변 환경 그래서 이것은 기본적으로 클라우드 셸을 수행하라고 말하고 있습니다 그리고 변환 그래서 우리의 첫 번째 단계는 모든 JPEG 데이터를 변환하는 것입니다 그래서 내가 변환하고 싶은 데이터가 있습니다

그래서 보자 승인 데이터는 다음과 같습니다 그래서 저는 꽃의 데이터 세트에 대한 교육을 받게 될 것입니다 그리고 나는 그것을 기본적으로 말하도록 훈련시키고 싶습니다

이들은이 심상에있는 꽃 종류이다 이미지는 모두 이렇게 보입니다 그리고 내가 훈련하고있는 CSV 파일은 이렇게 보입니다 승인 모두가 볼 수 있습니다

근본적으로 파일 이름입니다 또는 파일 또는 클라우드 저장소의 위치, 및 카테고리 승인 그래서 당신은 기본적으로 많은 이미지를 가지고 있습니다 이게 파일이고 이것은 카테고리입니다

CSV 파일로 저장했습니다 평가를 위해 비슷한 파일이 있습니다 따라서 교육용으로 하나, 평가 용으로 두 개의 파일이 있습니다 그게 당신이 필요한 전부입니다 승인

지금부터이 지시 사항을 따르십시오 모델 교육 그래서 우리의 첫 발걸음은 Cloud Shell 이러한 것들이 존재하는지 확인하십시오 그래서 나는 여기 아래로 갈 수있다 나는 Cloud Shell에 갈 수있다

그리고 그렇게해라 입력이 존재하는지 확인하십시오 다음은 레이블 사전을 찾는 것입니다 그리고 내가 여기서하고있는 것은 기본적으로 그 파일들을 가지고 일종의 일을하는 종류, 모든 레이블의 고유함 찾기 기본적으로 내가 가지고 있는지 확인하십시오 라벨의 표준적인리스트 그렇게해라

그리고 거기에 그것들은 내 데이터 세트에있는 5 가지 유형의 꽃입니다 그래서 그것은 지금 내 사전입니다 그리고이 시점에서 저는 TPU에 대해 기본적으로 훈련 할 준비가되었습니다 이제 JPEG 파일과 CSV 파일을 트레이너에게 제공 할 수 있습니까? 내가 GPU에서하고 있었다면, 그것은 내가하는 일과 정확하게 일치한다

권리 나는 입력 함수를 작성할 것이다 그것은 JPEG를 읽을 것입니다 그것은 그것을 훈련시킬 것입니다 그리고 나는 끝날 것이다

그러나 TPU를 훈련 할 때, 매우 조심해야 할 것이 있습니다 이는 TPU가 매우 빠르다는 것입니다 그리고 그것은 좋다 단 한가지 그게 뭐지? 관객 : 행렬 곱셈

LAK LAKSHMANAN : 행렬 곱셈 JPEG를 읽는 것이 좋습니까? 아니 그래서 우리는 무엇을해야합니까? 우리는 사전 처리를 할 것입니다 JPEG 파일을 가져와 우리의 CSV 파일, 모든 것을 가져 가라 기본적으로이를 TF 레코드에 넣습니다

따라서 모든 입력에 대해 하나의 파일을 읽는 대신 배치 – 배치를 처리해야하는 경우, 모든 파일을 읽어야하며, 정말로 느려질 것입니다 권리 TPU가 거기 앉아있을거야 우리의 입력 파이프 라인이 데이터 읽기를 끝내기를 기다리고 있습니다 그래서 대신 우리가 할 일은 그 모든 파일을 가져갈 것입니다

기본적으로 단일 TF 레코드 파일에 덤프합니다 그래서 우리는 한번에 거대한 배치를 읽을 수 있습니다 그리고 그런 식으로 우리는 지불되는 IO 오버 헤드를 제한합니다 이게 말이 돼? 그래서 첫 걸음, 그것을 TF 기록으로 변환합시다 TF 레코드로 변환 TPU 레포 자체에 그래서 TensorFlow, GitHub

TensorFlow, TPU 그래서 도구, 데이터 세트, 이것은 JPEG to TF Record라는 멋진 작은 프로그램입니다 그래서 우리는 단지 그것을 실행하려고합니다 승인 그래서 기본적으로 진행될 것입니다

모든 JPEG 파일을 가져 와서 변환하십시오 TF 기록으로 이것은 Apache Beam 프로그램입니다 Apache Beam에 대해 얼마나 많이 알고 있습니까? 빔 승인

Beam은 분산 된 실행 환경입니다 그래서 기본적으로 파이썬으로 코드를 작성합니다 그리고 당신은 다양한 다른 주자에서 그것을 실행할 수 있습니다, Flink를 포함하여 Spark를 포함하여 또한 Cloud Dataflow 및 GCP를 포함합니다 그래서이 다음 단계에서해야 할 일은 기본적으로 내 코드를 가져 와서 실행하려고합니다 승인

이 사전 처리 코드를 실행하십시오 그리고이 시점에서이 코드를 쏠 것입니다 구름에 무리에 분산 될 것입니다 다른 기계들

이 모든 파일을 처리 할 것입니다 TensorFlow 레코드를 만듭니다 그리고 TensorFlow 기록을 훈련시킬 수 있습니다 조금 시간이 걸릴 것입니다 왜냐하면 이 모든 데이터를 처리해야합니다

그래서 나는 Julia Child 일을 할 것입니다 나는 말할 것이다, 오, 나는 그것을 오븐에 넣었다 여기있어 그것은 이미 끝났어 권리

그래서 나는 이미 내 클라우드 스토리지 버킷에 있습니다 나는 내 클라우드 스토리지 버킷, 훈련 데모에 있기를 바랍니다 ML 사전 처리 된 데이터가 이미 있습니다 그래서 거기에 있습니다

그래서 꽃, 꽃, 꽃, 꽃 네 거기는 꽃들 그리고 사전 처리 된 데이터가 어딘가에 있습니다

어쨌든, 거기에 있습니다 그래서 내가 할 수있는 것은 기본적으로 진행하는 것입니다 코어를 가리키는 GCloud ML 엔진을 실행합니다 본질적으로 내가 방금 당신에게 보여 줬던 repo에서 온다 TPU에서 실행하십시오

TensorFlow 버전 18을 사용합니다 내가 그것을 테스트 한 사람이었습니다 그리고이 많은 이미지들로 그래서 이것이 당신이 바꾸어야 할 한 가지입니다

가지고있는 이미지의 수를 계산합니다 그리고 사전 처리 그것을 실행하십시오 당신은 숙련 된 모델을 가지고 있습니다 그리고 나서 훈련받은 모델을 가지고 나면, ML 엔진에 배포 할 수 있습니다

원하는 곳 어디서나 배포 할 수 있습니다 그런 다음 모델을 호출 할 수 있습니다 그것은 단지 파이썬 프로그램입니다 그리고 기본적으로 분류를 되 찾을 수 있습니다 JPEG 파일을 보냅니다

그래서 프로그램을 호출 할 때, TensorFlow 레코드가 필요하지 않습니다 JPEG 파일을 보내면됩니다 분류를 되 찾을 수 있습니다 그래서 질문? 결론적으로 최첨단 이미지 모델 거의 다 끝났어 권리

근본적으로 몇 가지 스크립트를 실행하십시오 당신의 데이터를 가져 가라 데이터가 해당 CSV 형식인지 확인하십시오 권리 파일의 이름

범주 코드 랩을 따라하면됩니다 예 관객 : 전에 모든 TensorFlow 데이터를 삭제해야합니까? 그게이 모든 공간을 차지하기 때문에? 이 JPEG 이미지를 확장합니까? LAK LAKSHMANAN : 우리는 실제로 JPEG 이미지를 확장하십시오 TensorFlow 레코드의 JPEG 이미지 압축 된 상태로 유지됩니다

JPEG 바이트 데이터로 남습니다 우리가하는 유일한 일은 우리는 그 파일에있는 JPEG 바이트 데이터를 가져 가고 있습니다 그리고 개별 파일을 읽는 대신, 그것은 하나의 TF 기록을 읽을 것입니다 라벨과 함께 1,000 대가 판매 될 것입니다 권리

그래서 좋다 그것은 본질적으로 우리가 한 일입니다 기본적으로 IO 히트의 양을 최소화했습니다 그 일이 일어나야 만합니다 관객 : 확대되지 않습니다

네 LAKSHMANAN : 네 데이터를 압축 해제하지 않습니다 아니 예

관객 : 이후 [INAUDIBLE] 훨씬 빨리? 맞아 예 전혀 비록 당신이이 변환을해야만한다고 지적했듯이, 그것은 훨씬 더 빠릅니다 왜냐하면 당신은 한 번만 변환을하기 때문입니다

그러나 당신은 매우 많은 신기원을 훈련합니다 전환을 75,000 번하는 대신 지금 75,000을하고 있습니다 전환을 한 번만 수행하십시오 그래서 페널티를 한번 지불하십시오 그리고 그 벌은 또한 다르게 스케일 할 수 있습니다

50 대의 컴퓨터에서 Dataflow 작업을 실행할 수 있습니다 2 개의 TPUs에서만 그것을 훈련하십시오 16 코어에서이 일을하는 대신 당신은 갑자기 많은 코어에서 그것을했습니다 왜냐하면 CPU는 값이 싸기 때문입니다 많은 CPU에서 그렇게하십시오

그럼 최첨단 이미지 모델에서 벗어나 봅시다 그래서 당신은 이미지 모델을 훈련시키고 자합니다 꽤 많이 코드를 가져 가라 귀하의 데이터에 그것을 실행합니다 그리고 훈련을 받았습니다

권리 그래서 기본적으로 당신이해야 할 선택 근본적으로 얼마나 큰 이미지 모델을 원하십니까? Resonant 50 또는 Resonant 18을 원하십니까? 또는 Resonant 120 뭔가? 이미지 수에 따라, 너는 더 깊고 깊게 갈 수있다 그래서 그것이 본질적으로 유일한 것입니다 네가하고 싶어 할지도 몰라 하이퍼 파라미터 튜닝이 필요할 수 있습니다

그리고 그것도 좋습니다 권리 이 모든 모델은 하이퍼 매개 변수 튜닝을 지원합니다 따라서 기본적으로 모델을 한 번만 교육하면 안됩니다 이 모든 다른 매개 변수들을 가지고 그것을 훈련 시키십시오

Resonant 모델의 깊이를 포함하여 그럼 조금 바꾸어서 어떻게할까요? 최첨단 텍스트 모델? 승인 텍스트가있는 이미지 모델과는 달리 그것은 정말로 중요합니다 권리 이미지는 일관된 형식입니다

모든 것은 동일합니다 당신은 기본적으로 이미지 모델을 훈련하는 것입니다 이미지 모델을 훈련하는 것뿐입니다 텍스트에는 몇 가지 차이점이 있습니다 당신이 처리해야만합니다

기본적으로 텍스트 모델을 할 때, 현대의 텍스트 모델은 본질적으로 네 단계로 구성됩니다 그들은 기본적으로 어디에 삽입합니까 그 모든 단어들을 취하여 숫자로 변환하고, 벡터로 그들이하는 두 번째 일은 그들이 지금 LSTM을 사용하여 인코딩합니다 그리고 나서, 훈련하는 동안, 당신은 기본적으로 그 문장에서주의를 옮기기 기본적으로 특정 길이의 LSTM 모델에 초점을 맞추기 위해 기본적으로 기대하는 것을 배울 수 있도록 거기서 무슨 일이 일어날 지 그리고 마지막으로,이 임베딩의 조합에서, 인코딩 한 다음 참석하십시오

기본적으로 예측하는 예측 단계가 있습니다 순서의 다음 단어 그러나 당신은 조건부 방식으로 그것을 예측하고 있습니다 그리고 예측 중에 빔 검색을합니다 다른 가능성 중에서 선택하십시오

승인 따라서 기본적으로 이러한 모델을 작성해야합니다 그리고 당연히, 이것들은이 평판을 가지고 있습니다 정말 열심히 훈련하기가 어렵고 옳은 것은 어렵다 정말 정말 멋집니다

도서관이있다 Tensor2Tensor 기본적으로이 최고의 언어 모델을 제공합니다 운 좋게도 TPU에서도 작동합니다 그러나 이미지와 달리 스크립팅 만이 아닙니다 우리는 여기서 어떤 일을해야합니다

그럼 우리가해야 할 일이 무엇인지 이야기 해 봅시다 그래서 우리가 기본적으로 쓰기를 원한다고 가정 해 봅시다 우리의 시선을 완성하는 기계 학습 모델 그래서이 행이 주어지면 우리는 모델이 이것을하고 싶어합니다 모델이 그렇게 할 것입니까? 아니

분명히 그렇지 않습니다 이 모델은 뭔가를 할 것입니다 그러나 그 아이디어는 기본적으로 그럴듯한 다음 줄을 만듭니다 그리고 기계 학습 모델을 어떻게 훈련 시키나요? 그럴듯한 다음 시선을 창조하기 위해서? 너는 그것과 함께 무엇을 훈련합니까? 관객 : [INAUDIBLE] 진짜 시들 진짜 시들로 그들을 훈련시킵니다

그래서 나는 무엇을 할 것인가? 나는 모든시를 보러 갈거야 내가 구할 수있는 프로젝트 구텐베르크에서 내 손을 뻗어 라 근본적으로 모든 것을 저주합니다 그리고 나의 입력은 한 줄로 구성 될 것입니다 그리고 내 출력은 다음 줄로 구성됩니다

그게 내 레이블이야 그리고 저는 기본적으로 그것을 제 모델에 제공 할 것입니다 말하자면, 이것이 나의 의견입니다 이것은 내 결과입니다 텍스트 입력

텍스트 출력 기차 공정한가요? 그러기 위해서, 우리가하는 일은 우리가 문제를 쓴다는 것입니다 그리고 그 점은 제가 입력 한 내용이 텍스트, 내 출력은 텍스트입니다 그래서 제가 가지고있는 것은 Tensor2Tensor의 텍스트 – 텍스트 문제입니다

그래서 나는 텍스트에 텍스트 문제가있다 그리고 나는 시선 문제라고 부릅니다 왜냐하면 나는 시의 한줄을 예측합니다 그리고 나서 나는 기본적으로 몇 단어 나는이 모델이 기억되기를 바란다 자, 나는 많은시를 얻을 것이라고 생각했습니다

그러나 사람들이 그 많은시를 쓰지 않는 것으로 밝혀졌습니다 결국 나는 궁극적으로 결국 약 6 만 줄의시 그래서 그것은 아주 큰 데이터 세트가 아니 었습니다 그래서 나는 여기서 나의 어휘를 제한해야했다 권리

그래서 저는 12 단어의 2 승을했습니다 이시 데이터베이스에서 가장 공통적 인 4,000 단어를 배우십시오 그래서 그것은 나의 어휘의 크기입니다 그리고 나서 generate samples 함수를 작성해야합니다 데이터 디렉토리가 주어지면 기본적으로 양보 할 것입니다

두 가지로 구성된 사전, 입력 그리고 목표물 필자의 경우 입력은 이전 줄입니다 목표는 현재 줄입니다 공정한가요? 그래서 그것은 내가 작성하는 코드입니다 내 어휘는 어떤 종류의 문제인가? 텍스트 – 텍스트 문제 – 그리고 나는 뭔가를 읽고 싶다

나는 뭔가 쓰고 싶다 그리고 나서 기본적으로 나에게 데이터를 생성 해달라고 말했습니다 그래서 이것은 다시 이미지에서해야 할 일과 매우 유사합니다 나는 거기에 TPU가 앉아있는 것을 원하지 않는다 기본적으로 20 줄의시를 모든 곳에서 읽습니다

나는 기본적으로 이런 방식으로이 데이터를 만들고 싶다 입력, 출력 오버 헤드가 최소화됩니다 그래서 내가하고있는 일은 내가 기본적 으로이 데이터 세대를 실행, 포인팅 이것이 문제 다 내 데이터 디렉토리입니다 그래서 기본적으로 계속해서 읽으십시오

TensorFlow 레코드를 작성하십시오 공정한가요? 그리고 그것이 할 수있는 이유는 내가 말했기 때문입니다, 내 데이터 파일이 있으면 입력과 출력을 어떻게 만듭니 까? 기계 학습 모델에서? 정말로 그것에 대해 생각할 때 알아야 할 전부입니다 입력 내용은 어떻게 작성합니까? 출력물은 어떻게 만듭니 까? 그런 다음 기본적으로 모든 데이터를 통과합니다 이 디렉토리에 지정한 TensorFlow 레코드를 만듭니다 TensorFlow 레코드가 있으면, 우리는 모델을 훈련 할 준비가되었습니다

하지만 그 때 깨달았습니다 이봐, 내 모델 위대하지 않을 것입니다 그것은 위대하지 않을 것입니다 왜냐하면 저는 충분한 데이터가 없습니다 첫 번째 그래프는 내가 당신을 보여줬다는 것을 기억하십시오

스크래치 모델에서 얼마나 많은 데이터가 필요합니까? 권리 전형적인 Tensor2Tensor는 기본적으로, 영어에서 독일어로, 모두에서 설치 유럽에서 주어진 연설 중 의회 또는 뭔가 거대하고 거대한 데이터 세트입니다 그리고시 60,000 라인을 제공 할 것입니다 큰 일은 아닙니다

그래서 제가하고 싶은 것은 기본적으로 모델을 작게 만드는 것입니다 그래서 이것들은 나의 하이퍼 파라미터들이다 나는 기본적으로 두 개의 숨겨진 레이어를 사용한다고 말하고 있습니다 128 노드 만 사용하십시오 그리고 그들을 512로 필터링하십시오

그리고 내 관심 머리 어느 시점에서 몇 단어를 볼 수 있습니까? 한 번에 4 단어 만보십시오 그리고 많은 중퇴를하십시오 탈락은 무엇을합니까? 관객 : 뉴런을 차단합니다 LAK LAKSHMANAN : 드롭 아웃은 뉴런을 차단합니다

권리 그리고 기본 아이디어는 지나친 피팅을 제한한다는 것입니다 데이터 세트가 작을수록 더 많은 드롭 아웃이 필요합니다 그래서 내 데이터 세트가 너무 작기 때문에, 기본적으로 탈락을 늘릴 것입니다 그리고 나는 나의 학습 속도를 늦추 게 될 것이다

나는 많은 양의 데이터를 가지고 있지 않기 때문에 그래서 낮은 학습 속도를 사용하십시오 그게 내 하이퍼 매개 변수입니다 내 모델에 적용되는 작은 종류의 튜닝입니다 그리고이 시점에서, 저는 그냥 가서 훈련시킬 수 있습니다

그리고이 모델은 변압기 모델입니다 그리고 나는 변압기 시로 설정된 하이퍼 매개 변수를 가지고 있습니다 그것이 내 파이썬 함수의 이름이기 때문입니다 이 하이퍼 매개 변수 집합을 반환합니다 그래서 나는 그 하이퍼 매개 변수를 사용할 것입니다

하나의 GPU가있는 ML 엔진에서 실행하십시오 또는 4 개의 GPU 또는 8 개의 GPU가있는 ML 엔진에서 실행하십시오 또는 무엇이든 이걸 TPU에서 실행하고 싶다면 – 이것은 작은 데이터이기 때문에 낭비입니다 그것은 GPU에서 몇 시간 만에 훈련시킵니다

하지만 내가 말하는데 20 시간 만에 훈련하는 걸 원하지 않아 12 분 후에 훈련 시키길 바래 나는 기본적으로 그것을 튀기고, GPU 부분을 제거하고, 마이너스, 마이너스를 추가하거나 TPU를 사용하십시오 그리고 그것은 꽤 많이 있습니다 권리

그리고 어떤 변압기가 할 것인가? 이 플래그가 설정되어있는 경우, 내가하고있는 일을 TPU 재 작성에 맡기십시오 그 밑에있는 모든 것은 기본적으로 이미있는 모든 코드로 TPU 재 작성을 호출합니다 작성되었습니다 공정한가요? 관객 : 당신이 그 깃발을 설정하면 얼마나 많은 TPUs를 사용합니까? LAK LAKSHMANAN : 지정할 수 있습니다 원하는 코어 수를 지정할 수 있습니다

관객 : [불충분]처럼 LAK LAKSHMANAN : 그렇습니다 청중 : 당신이 검증 데이터를 할 때, 시가 제대로 나온거야? 보게 LAK LAKSHMANAN : 보자 아직 실행 중인지 모르겠습니다

그러나 그것은 멋진 일입니다 잠시 동안 나는 그것을 달리고 있었다 시 그리고 보자 나는 그것이 ML Poetry라고 생각합니다

아직 실행 중인지 확인해 봅시다 그래서 그것은 블로그 게시물이었습니다 그리고 어딘가에 링크가있었습니다 내가 문 닫을 지 모르겠다 하지만 그렇지 않다면

승인 그래서 내게 줄을주십시오 죄송 해요

관객 : 언제 다시 만날 것인가? 언제 다시 만날까요? 관객 : 우리는 다시 만난다 LAK LAKSHMANAN : 우리는 다시 만난다 승인 다시 한번 말하지만, 그것은 똑같은시를주지 않을 것입니다 아니

당신은 그것이 다른 시가되기를 원합니다 그래서 이것은 앱 엔진 일입니다 그래서 어느 누구도 잠시 동안 그것을 운영하지 않습니다 하지만 2 ~ 3 초 안에 다시 나타납니다 그것이 무엇을하는지 봅시다

달콤한 단독에서 길잃은 물 [웃음] 적어도 시적인 해보자 그 라인을 가져 와서 다음 줄을 만들어 보겠습니다 우리는 각각 톱질을한다

아 그것은 끔찍한시입니다 승인 어서 누군가 다른 줄을 내놔

관객 : 숲은 사랑스럽고 어둡고 깊습니다 LAK LAKSHMANAN : 숲은 사랑스럽고 어둡고 깊습니다 아 여기 로버트 프로스트 애호가들 오, 오류

[웃음] 어떻게 된 거예요? 오 아직 오래 죽지 않았고 레이를 어떻게 다룰 수 있 었는가 오, 그 소리가 꽤 좋네요 예 청중 : 그림을보고시를 할 수 있습니까? LAK LAKSHMANAN : 그림을보고시를 할 수 있습니까? 전혀

그것은 텍스트에서 이미지 모델이 될 것입니다 그리고 데이터가 충분하다면 훈련 할 수 있습니다 이미지 및 이미지 라인의 집합입니다 관객 : 해본 적이 있습니까? 미안 해요 내가 해냈어? 아니, 나는하지 않았다

다시 말하지만, Project Gutenberg에 대해 생각하기에는 너무 쉬웠습니다 가고시를 구경하고 훈련 시키십시오 전과 마찬가지로, 지금, 나는 사실을 잊어 버리고 싶지 않다 그래, 재미있는 일이야 그러나이 노트북은 GitHub에서도 사용할 수 있습니다

그래서 당신은 그것을 볼 수 있습니다 너는 그것을 밖으로 시도 할 수있다 그것을 실행 해보십시오 GPU에서 실행할 수 있습니다 TPU에서 실행하십시오

권리 그리고 모든 코드가 있습니다 그러니 계속 시도해보십시오 그래서 마지막 비트 사용자 정의 모델

승인 이제 이미지 모델을 만드는 방법을 알게되었습니다 그냥 이미지 모델을 가져 가라 텍스트 모델을 선택하십시오 우리는 어디서 찾아야하는지, 어떻게 달릴 지 알고 있습니다

마지막으로 얘기하고 싶은 부분 당신이 당신 자신의 커스텀 모델을 작성했다면 어떨까요? 그리고 나는 당신이 Estimator를 사용하여 그것을 썼다고 가정 할 것입니다 Keras로 작성한 경우 기본적으로 Keras를 작성합니다 모델 후에는 Estimator에 Keras 모델을 수행하고, 당신은 견적을 얻을 것이다 Keras 모델의 함수 호출 중 하나입니다 model

compile을 수행 한 다음 modeldoestimator를 수행하면, 너는 평가자를 가지고있다 그래서 아이디어는 기본적으로 TPU에서 실행하는 것입니다 그럼 어떻게해야합니까? 해당 복제를 사용 가능하게해야합니다 어떻게 복제 할 수 있습니까? 크로스 샤드 옵티 마이저 사업

권리 우리는 또한 호스트 대기 시간을 피하고자합니다 호스트 대기 시간은 어떻게 피합니까? 청중 : TF3로 변환 LAK LAKSHMANAN : TF 기록으로 변환 그들을 모두 한 곳에 모으십시오

당신은 정적 모양을하고 싶습니다 이제, 우리가 그다지 이야기하지 않은 것입니다 우리는 행렬 곱셈기를 가지고 있다고 말했습니다 그것은 무엇과 함께 작동합니까? 특정 크기의 행렬로 작동합니다 3×3 행렬을 곱하면됩니다

낭비입니다 괜찮아 그래서 우리가 할 일은 우리가 기본적으로 거대한 행렬을 가져 와서 증식합니다 그리고 그 행렬은 수축기 배열입니다 이 변수 모양이 될 수 없습니다

정적 인 모양이어야합니다 그래서 우리가 할 일은 TensorFlow의 정상적인 동작입니다 프로그램을 통해 배치 크기를 질문으로 읽습니다 모양을 표시하십시오 우리는 그렇게하지 않을 것입니다

TPU 프로그램에서는 정적 인 고정 된 모양을 갖게됩니다 일반적으로 문제가되지 않습니다 그러나 언어 모델과 같은 것들이 있다면, 예를 들어, 각 배치를 다르게 패딩 할 수도 있습니다 배치에서 가장 긴 문장을 기반으로합니다 그게 효과가 없을거야

당신은 그것을 코퍼스에서 가장 긴 문장에 덧붙여 야합니다 승인 예 관객 : 샤딩 때문에이 제한이 있습니까? LAK LAKSHMANAN :이 제한은 사실 때문에 속도 향상은 MXU 때문에 발생합니다 행렬 곱셈

행렬 곱셈은 수축 계열입니다 정적 인 모양이 필요합니다 이 속도를 최적화 할 수 있습니다 승인 그래서 당신은 텐서의 패딩을해야 할 것입니다

그러면 어떻게 할 수 있니? 글쎄, 니가하는 일은 기본적으로 너야 TF 데이터 API를 사용하여 데이터를 읽으십시오 그리고 TF 데이터 API를 할 때, 훈련 중에 영원히 반복하므로 남은 일괄 처리가 전혀 없습니다 모든 배치는 특정 크기입니다 그리고 TF 기록을 읽습니다

우리는 그것에 대해 이야기했다 TF 기록을 읽습니다 다른 것을 읽지 마십시오 기본적으로 병렬 인터리빙을 수행합니다 그래서 당신은 기본적으로 그것을 읽으므로 모든 노동자 자체 데이터 복사본을 가져옵니다

그리고 사전 처리 등을 할 때, 당신은 평행 한 배치로 그들을합니다 그래서 프리 페치를 호출합니다 그리고 항상 정적 크기를 유지해야합니다 따라서 평가 데이터 집합이 315 일 경우, 기본적으로 8로 나눌 수 있도록 만들고 싶습니다 당신은 3 개의 이미지 또는 다른 것을 버립니다

권리 그렇게하면, 그리고 나서 당신은 첫 번째 차원이 배치 크기인지 확인하십시오 따라서 필요한 경우 입력 내용을 조 변경하십시오 권리 그리고 기본적으로 아무것도 만들지 않습니다

TensorFlow 모양에 물음표가있는 실제로 크기를 지정합니다 이것이 기본적으로하는 일입니다 기본적으로 모양을 설정합니다 부분적으로 알려지지 않은 것이 있다면 모양을 설정하십시오 그리고 나서 기본적으로 TPU 견적기를 생성합니다

정규 추정기 사양의 다시 말하지만, 저는 이것을 실행하고 있습니다 그러나 우리는 데크를 사용할 수있게하려고 노력할 것입니다 그래서 당신은 그것을 얻을 것입니다 그러면 Jupyter 노트북에서 본 내용 클러스터 확인자로 TPU를 찾으십시오

그리고 TPU를 찾으면 기본적으로 진행됩니다 기차를 평상시대로하는 방법을 훈련하고 평가합니다 평가합니다 이걸로,이 아이디어가 있습니다 TPU에서 실행하는 몇 가지 기능이 있습니다

그리고 몇 가지 기능이 있습니다 TPU에서 실행하지 마십시오 일반적으로 모든 입출력은 TPU에 없습니다 TPU에있는 모든 것은 모두 행렬 수학입니다 따라서 대부분의 기계 학습 모델에서, 모델 기능은 TPU에 있습니다

예 관객 : 내가 볼 수있는 프로파일 러가 있습니까? LAK LAKSHMANAN : 그렇습니다 TPU 프로파일 러가 있습니다 그래서 당신이 그것을 실행하면, 그것은 당신에게 말할 것입니다 실행중인 함수의 일부 는 TPU에 최적화되어 있으며, 그리고 어떤 퍼센트가 최적화되지 않았습니까? 우리는 약 70 %를 촬영하려고합니다

100 %에 도달하는 것은 정말 어렵습니다 그러나 우리는 약 70 %를 촬영하려고합니다 그리고 전처리 과정을 모두 진행할수록 그 모든 것들 입력 함수에 넣고 모델을 떠난다 함수 원시, 더 높은 분수가 얻을 것입니다 마지막으로 모델을 저장합니다

그리고 멋진 점은 모델을 저장하고 싶다는 것입니다 그것은 단지 정상적인 모델입니다 그리고 CPU 나 GPU에서 서비스 할 수 있습니다 또는 TPU로부터 승인

따라서 모델을 내보낼 수 있습니다 모델을 내보낼 때 모델을 내 보냅니다 TPU 서빙 형식과 GPU 서빙 형식 둘 다에서 사용할 수 있습니다 그래서 당신은 그것들 중 하나에서 봉사 할 수 있습니다 그래서 내가 방금 돌진했던 모든이 단계들, 그들은 이제 그 블로그 포스트에서 설명됩니다

그리고 GitHub 레포도 있습니다 그래서 그 코드가 무엇인지를 보여줍니다 그리고 그걸로, 나는 단지 플러그를하고 싶습니다 우리는이 승진을 계속하고 있습니다 우리에게는 많은 훈련 과정이 있습니다

Coursera에서 Courseraorg/NEXTExtended에 가면 – NEXT가 끝났다고 아무에게도 말하지 마라 그냥가 NEXTExtended, 그리고 당신은 기본적으로 얻을 수있을 것입니다 나는 1 개월 무료라고 생각한다 승인

따라서 Google Cloud의 모든 과정을 수강 할 수 있습니다 그 링크로 한 달 동안 무료로 시원한? 그래서 어떤 과목? 한 무리의 코스가 있습니다 한 달 동안 무료로 가져갈 수 있습니다 그래서 그것이 링크입니다

Courseraorg/NEXTExtended [박수 갈채] [음악 재생]