Bringing Clinical Data to GCP for Automated AI Discoveries (Cloud Next ’18)

[음악 재생] 오르 켈 클레멘스 : 환영합니다 오늘 우리와 함께 해줘서 고마워

오늘 우리가 너와 얘기하고 싶은게 있니? Imagia에서의 여정의 초기 단계입니다 인공 지능을 가져 오는 데 도움이되는 공동 작업 생태계 구축 건강 관리 그리고 바로 박쥐를 제발, 내가이 말을하도록 허락 해주세요 공개적으로 저의 첫 번째 이야기입니다 그래서 긴장된 것 같다면, 나는 그렇기 때문입니다

[웃음] 고맙습니다 우리는 당신을위한 기분을 얻기 위해 빠른 초기 조사를하겠습니다 청중? 청중에서 보건 의료 분야에서 일하는 사람들에게 물어봐 주시겠습니까? 빨리 손을 들어 줄래? 그래, 그거 좋은 번호 야 그리고 이들 중 누가 실제로 임상 연구에 참여하고 있습니까? 그것은 적다 그리고 이미 누가 AI 시스템을 프로덕션 환경에 배포하고 있습니까? 더 작아

그리고 그 방향으로의 마지막 질문, AI를 임상 연구에 사용하고있는 사람은 누구입니까? 축하해 그리고 우리가 한 가지 개인적인 질문을 할 수 있다면, 청중에있는 사람 암에 걸린 사람을 알고 있습니까? 그것은 매우 큰 숫자입니다 그래서 더 이상 고집하지 않고, 제 이름은 Clemens Oertel입니다 또는 독일어 발음을 아는 사람들에게 Clemens Oertel 나는 프로그램 매니저와 소프트웨어로 일해왔다

이매 지아의 건축가, 연방의 도움 및 추적 성 노력 고마워, 클레멘트 오르 켈 클레멘스 : 조나단 안녕, 모두들 제 이름은 조나단 카네 브 스키입니다

여기에 근거한 공인 된 재건 외과 의사 캘리포니아에서 그리고 Imagia에서 팀을 이끌고 있습니다 임상 혁신 분야에서 그래서 데이터, 인공 지능 및 건강 관리에 관한 우리의 대화에 뛰어 들기 전에, 클레멘스와 나는 너와 나누고 싶었다 건강 관리 공상가의 말 폭발을 실제로 예견 한 사람 건강에 큰 데이터의 당신이 저쪽에있는 래리 위드 박사님, 그는 지식 커플러라는 용어를 만들어 냈다

그는 매사추세츠에서 유명한 그랜드 라운드 강연을했습니다 1960 년에 종합 병원 (General Hospital)에서 의사가 가능할 수있는 방법이 없다고 환자와 관련된 모든 데이터를 관리합니다 그는 오늘의 개념을 만드는 책임이 있습니다 의료 기록입니다 그리고 나는 너와 나누고 싶었다

60 년 전 빅 데이터와 건강에 관해 그가 말했던 것 케어 Larry Weed : 나는이 문제를 해결하려고한다 기록의 관점에서가 아니라 내 말은, 우리는 정말로 기록을 돌보지 않는다는 뜻입니다 우리는 사람들을 돌보고 있습니다 그리고 우리는이 기록이 그 환자를 돌보는 것과 분리 될 수 없다

이건 의학의 실천이 아니야 그리고 여기 기록이야 이것은 의학의 관행입니다 그것은 그것과 얽혀 있습니다 장기적으로 당신이하는 일을 결정합니다

당신은 그것의 희생자이거나 그것 때문에 당신이 승리했습니다 인간의 마음은 단순히 모든 정보를 전달할 수는 없습니다 모든 환자는 실수없이 연습을합니다 그래서 자네가 볼 수 있네 건강에 큰 영향을 미친다는 생각 정말로 새로운 것이 아닙니다 그러나 우리는 오늘 거의 6 년 후에 앉아 있습니다 그것을 토론하면 래리 위드 박사가 완전히 될 것이라고 생각합니다

우리가 건강에 너무 많은 노력을 기울이고 있음을 알기에 황홀합니다 관심과 인공 지능 그래서 나는 내 경험에 대해 조금 말하고 싶다 내가 왜 건강 AI에 관심이 있는지 내가 당신에게 우리 회사 Imagia의 배경을주기 전에 내가 거주하는 동안 나는 나의 관심을 시작했다

외과 입소자로서 정말로 고통당하는 수많은 환자들에게 노출되었다 의료 시스템에서 – 특히 한 명의 환자, 어린 소녀 전이성 유방암으로 사망 한 사람, 누가 완전히 놓친 종양이 있었다 선별 유방 X 선 사진 그리고 나는 그녀가 돌아간 직후에 기억합니다 나는 그녀의 유방 조영술을 통해 밤을 보냈다

거기에 없었던 종양을 찾기 위해서 어떤 방법이 있어야한다고 생각해 인간의 눈은 단지 캡쳐하지 않는다는 것 임상 적으로 무엇이 있는지 그래서 나는 컴퓨터 과학자 팀을 만날만큼 운이 좋았다 이 문제에 종사하고 있던 이매 지아 팀을 구성하여 시도하고 찾길 원했습니다 실제로 AI 솔루션을 가져 오는 방법 건강 관리를 변형시킨다

따라서 Imagia는 2015 년에 설립되었습니다 우리는 40 명 이상의 직원으로 구성된 회사입니다 우리는 몬트리올 AI 생태계와 긴밀한 관계를 맺고 있습니다 몬트리올 연구소와 훌륭한 관계가 있습니다 가장 큰 그룹의 박사 과정 중 하나 인 학습 알고리즘 캐나다에서 인공 지능 연구를하고 있습니다

그리고 우리는 5 개 병원과 적극적으로 협력하고 있습니다 북미 및 유럽 지역 그래서 오늘 클레멘스와 저는 우리의 큰 그림을 당신과 함께 나누고 싶습니다 사명 또한 다음과 같은 기술적 세부 사항을 발견 능력을 키우는 생태계를 구축하는 방법 임상 적용 용

그렇다면 우리는 AI로 환자의 여행에 어떤 영향을 미칩니 까? 우리가 집중하고있는 좋은 사례는 폐암입니다 X 선 또는 저선량 CT를 이용한 스크리닝 나중에 환자의 진단과 함께 여행하게 조직 검사, 표적 항암 화학 요법, 그리고 마침내 수술로 그리고 회복에 긴 길, 환자의 여행의 각 단계는 우리에게 중요합니다 여행의 각 단계를위한 인공 지능 도구 만들기 포괄적 인 치료로 이어집니다 삶의 질과 같은 가치 기반 결과에 초점을 맞추고, 뿐만 아니라 사망률 환자의 여행 첫 단계 긴 길에서 진단된다는 것이 무엇인지 폐암과 함께 선별 검사 중입니다

폐암은 암 관련 사망의 주요 원인입니다 일반 인구를 가려 내기위한 최선의 노력에도 불구하고 – 주로 흡연자 – 많은 폐암 환자는 담배를 피지 않습니다 우리가 AI의 가치를 전달하고자하는 곳 환자를 일찍 발견하고, 병기 1 기, 가장 쉽게 치료할 수 있습니다 상영은 대개 시작입니다 두려움으로 가득차있는 환자 여행, 많은 알려지지 않은 것들은 종종 사실에 의해 더 나 빠졌다

많은 환자들이 진행성 병으로 진단받습니다 말기 병으로 진단 받고있다 거의 20 배의 사망 확률을 의미합니다 그래서 초기 단계에서 질병을 찾는 것 결과를 개선하는 가장 좋은 방법입니다

일단 폐암이 발견되면, 진단을 확립하는 과정 종종 길고 성가신 과정이다 오른쪽 치료를 선택했다 그렇다면이 과정이 왜 시간이 많이 걸리고 혼란 스럽습니까? 잘 알기가 어렵습니다 모든 환자에게 가장 비싼 분자 검사를해야합니까? 곧? 환자가 1 차 요법에서 시작해야 하는가? 그들이 병기가 진전되면, 또는 그들이 표적으로 한 면역 요법 권리에 전진되어야하는지 진단 시점부터? 그래서 오늘날의 패러다임에서 실제로 두 가지 방법이 있습니다 진단을 내린다

그것은 현재의 금본위 제인 조직 생검이거나, 또는 액체 생검 조직 생검은 외과 의사 또는 종양 전문 의사 조직을 꺼내 병리학 자에게 보냅니다 종종 금본위 제로는 좋지 않습니다 우리가 생각하기에, 시간의 40 %까지, 반복 생검이 필요하거나 또는 채취 된 조직 확립을위한 적절한 시험을 위해 보내지 않았다 올바른 진단

시작과 끝은 액체 생검이라고하는 기술입니다 인기가 높아지고, 무엇이 수반되는지 환자의 혈액을 채취하고 샘플링하고있다 창고에 묻힌 종양 DNA를 찾는 것 개가 머리카락을 털 듯이 그러나, 당신이 상상할 수 있듯이, 그것도 그 자체의 문제를 가지고 있습니다

머리카락과 개가 많이 나오는 개가있는 것처럼 머리카락이 거의 없으며 모든 종양이 DNA를 똑같이 방출하지는 않습니다 이 암의 최대 25 %는 흘리지 않습니다 DNA는 액체 생검이 실패한다는 것을 의미합니다 그래서 일어나는 일은 많은 병원들에서 많은 임상 환경, 전문가 – 병리학 자, 종양 전문의, 외과 의사 – 최선의 노력에도 불구하고 통신하려면 사일로에서 작동해야합니다 그들은 서로 가깝게 상호 작용하지 않습니다

우리가 환자 치료에 성공하기 원한다면, 우리는 사일로를 초월하여 사용할 필요가 있습니다 인공 지능은 진단을 가속화합니다 진단을 한 후에, 다음 단계 환자의 여행에서 치료를 최적화하는 것입니다 정밀 의학은 15 년 전에 혁명을 일으켰습니다 그러나 아직까지도 환자에게 매일 영향을 미친다

예를 들어, 아주 적은 약물이 있습니다 암에 대한 알려진 유전자 돌연변이를 목표로하는 우리는 여전히 좋은 방법이 없습니다 면역 요법 치료를위한 환자 선정 암 진단을받은 대다수의 환자 면역 요법으로 치료할 수있는 선택권이 없습니다 이것은 환자가 대개 첫 번째 또는 두 번째 라인 치료가 실패한 경우 종양이 재 생생되기 전에 종양 특이성 특정 면역 요법으로 표적화 될 수 있는지 확인하십시오

환자가 적절한 면역 치료를받는 경우에도, 그 환자의 90 % 정도가 종양을 가질 것입니다 그 약물에 내성이있다 그리고 그것은 암세포의 작은 집단들 그 집단 내에서 단지 저항력이 있습니다 우리 플랫폼으로, 우리가하고자하는 것은 무엇입니까? 의사가 인공 지능을 사용하여 지형지 물을 식별하도록 권한 부여 환자에게 도움이 될 수있는 눈에 보이지 않는 적절한 치료를받으며 위험하고 값 비싼 것을 피하십시오 생검 및 분자 검사

이 연극의 한 예가 깊은 방사능 분야에서 그래서 radiomics는 진화하는 분야입니다 우리는 정보가 있다는 것을 믿는다 인간의 눈에는 접근 할 수없는 이미지에서 – 예를 들어, 질병과 관련된 패턴 종양에 특정한 형태가 존재합니까? 그것의 유전 적 상태를 나타낼 수 있습니까? 폐암이 EGFR 양성균 일 수 있음 방사성 지문에요? 이것이 작용하는 곳은 면역 요법입니다

그래서 손에 들고 누가 점심을 먹었습니까? 대부분의 사람들이 여기 있지만 일부 사람들은 점심을 건너 뛰었을 수도 있습니다 어떤 사람들은 아침을 건너 뛰었을지도 모른다 하지만 여기서 모두에게 마라톤을달라고 요청하면, 모두 다 다르게 행동 할거야 모두에게 면역 요법을 제공한다면 똑같은 방법입니다 누가 그 면역 요법을 할 수 있었습니까? 그들의 시신은 다르게 반응 할 것입니다

모두의 면역 체계가 다른 화장을하기 때문에 그리고 암에 대한 면역 요법에서 면역 체계가 필요합니다 그 면역 요법과 병용하기 위해 적절하게 준비해야한다 암을 표적으로 삼는다 그래서 이것이 많은 면역 치료 요법이 실패하거나 그러한 결과의 범위가 다양합니다

우리는 누군가의 면역계의 상태를 모르기 때문에 그 전에 면역 요법이 주어져야합니다 이것은 깊은 방사성 물질이 영향을 미칠 수있는 곳입니다 우리가 전에 없었던 곳에서 통찰력을 제공하십시오 AI 모델을 CT 나 MRI로 훈련시킬 수 있습니까? 병리학 정보와 결합 면역 조직 화학에서 확인하기 우리가 면역 요법을하기 전에 환자의 면역 상태 그래서 우리는 언제 면역 요법을 할 가장 이상적인시기인지 알았습니다 최상의 결과를 얻으려면? 그래서 마침내 환자들은 상영되었습니다

그들은 진단을 받았습니다 그들의 치료가 전달되었습니다 최적의 방식으로 그러나 지금은 회복하기위한 긴 길을 시작합니다 화학 요법은 환자들에게 심장 문제, 위장 문제, 피부 손상 방사선 요법으로 돌이킬 수없는 피해를 입 힙니다

피부와 면역계에 당신이 그것에 대해 생각한다면, 우리는 정말로 한 시대에 살고 있습니다 사람들이 암에서 살아남는 곳, 그러나 지금은 암의 치료로 더 고통 받고있다 질병 자체보다 암 치료는 고귀하고 기념비적 인 업적이며, 그러나 지금 우리는 또한 이환율을 최소화하는데 초점을 맞추어야합니다 암이 있습니다

이러한 보살핌을 바꾸기 위해, 우리는 주어진 질병 이상으로 치료해야한다 치료 전략 개발에 중점을 둡니다 환자의 상해를 최소화 할 수있다 그들의 독특한 생물학적 화장에 우리가 발견 플랫폼을 구축함에 따라 임상 채택을 강화하려면 기억해야하는 것이 중요합니다 의료 교육 시스템이 얼마나 불완전한 지 알 수 있습니다

정보는 끊임없이 진화하고 있습니다 전세계 학술 사일로에서, 이 정보를 공유하는 주요 매체 간행물 및 저널을 통한 것입니다 의사로서, 내가 거의 말할 수있어 오늘날 의사가 정확한 최신 정보를 유지하는 것은 불가능하다 의료 과학의 최신 발전, 이러한 진보를 실제로 사용하는 것이 더욱 어렵습니다

의료 행위로 그래서 네트워크에서 연합 의료 데이터 사용 우리에게 한걸음 더 가까이 이해하게 해줄 것입니다 우리가 관찰 한 무작위성의 그래서 기어를 의학적 측면에서 기술적 측면으로 전환하기 전에 이야기의, 나는 너를 떠나고 싶다 이 점은 Imagia에서 우리가 구축하려고하는 것입니다 우리가 의사에게 가져올 수있는 힘을주는 생태계입니다

임상 적용을 창출하기위한 임상 전문 지식, AI 전문 기술을 통해 발견, 궁극적으로는 건강 관리를 변화시키는 인공 지능을 만들기 위해 함께합니다 그래서 마이크를 클레멘스로 넘겨 줄거야 이 마술이 어떻게 일어나는지를 너와 함께 나누기 위해 및 기술 세부 사항 오르 켈 클레멘스 : 고맙습니다, 조나단 조나단이 우리에게 보여준 것을 토대로, 우리는 Imagia에서 AI 작업과 관련이 있다고 믿습니다

임상 질문에 가장 잘 공식화 임상의에 의해 그러나 대부분의 임상의는 AI 전문가가 아니며, 그게 바로 우리가 시도하는 것입니다 임상의가 플랫폼과 함께 할 수 있도록 현재 Google Cloud를 기반으로하는 Imagia로 구축 중입니다 플랫폼– 임상의의 발견에서 인공 지능을 사용하는 것 인공 지능의 세부 사항을 알 필요가 없습니다 Jonathan은 이미 몇 가지 가능한 질문을 언급했습니다

인공 지능 분야에서 예를 들어 예측할 수있는 것처럼 유용하다 하나의 치료법의 효능 특별한 환자 – 큰 통계적 근거가 아니라 한 명의 환자에게 – 조기에 획득 한 정보를 토대로 치료의 연속체에서? 오늘날 대부분의 경우 표준 치료 계획이 있습니다 우리는 가장 보편적으로 적용 가능한 치료법을 먼저 적용하고, 그게 효과가 없을 때만 우리는 계속 나아 간다 더 진보 된, 더 값 비싼 처리에 그리고 이것은 비용 관점에서 이해할 수 있습니다

공중 보건의 관점에서 그러나 개별 환자의 경우이 최선의 접근 방식이 아닐 수도 있습니다 또한, 악성 종양을 결정할 수 있습니다 이른 이미징에 기초한 종양의 종양의 EGFR 상태와 같은? 이렇게하면 임상의가 올바른 치료법을 선택할 수 있습니다 일찍

또는 더 일반적으로 표현하기 위해, 획득 한 원시 데이터를 기반으로 환자 결과를 예측할 수 있습니까? 치료의 연속 초기에? 이 질문들에 대답하기 위해, 보통 후 향적 임상 연구를 실시합니다 그리고 당신에게 약간의 배경을주기 위해서, 그러한 연구를 수행하는 첫 번째 단계 일반적으로 그 연구를 위해 환자 코호트를 구축하는 것입니다 그 결과를 위해 환자 코호트를 구축한다는 것은 적절한 환자 기반을 찾는 것을 의미합니다 과거의 진단이나 치료 결과, 예를 들어 일한 의약품 또는 종양이 악성이거나 양성이었다 그리고 그것은 대개 거대한 양을 통과하는 것을 포함합니다

임상 기록 – 텍스트 기록 이것은 실제로 앉아있는 임상의들입니다 거기서이 기록들을 샅샅이 뒤지면서, 올바른 기록을 찾는 것, 적절한 환자 이 기록들은 구조화되지 않았기 때문에 그런 종류의 심문에 대해 그 일은 지루하고 힘든 일입니다 툴킷 또는 툴링 중 하나 Imagia가 이것을 돕기 위해 개발 한 NLP와 적극적인 학습을 기반으로, 임상의는 몇 가지 보고서에 태그를 지정할 수 있습니다

그러면 모든 기록을 검토 할 수 있습니다 거기에 최고의 성냥을 찾는다 이러한 초기 선택을 기반으로 더 큰 코호트를 구축 할 수 있습니다 그리고 물론, 불행히도, 이것은 우리는 전제에서 일어날 수밖에 없습니다 병원에서 전체 데이터 코퍼스에 액세스해야합니다

다음 단계는 마찬가지로 어렵습니다 기억하기 때문에 해당 이미지 데이터를 찾는 것입니다, 우리는 매우 초기 이미지를 기반으로 할 수 있기를 원합니다 우리가 알기도 전에 그 환자에게 일어나는 일, 매우 늦게 결과 불행히도 조나단은 이미 지적했듯이, 이 데이터는 서로 다른 사일로에 있습니다 그 데이터를 연결하는 것은 쉬운 일이 아닙니다

그리고 이것은 AI의 또 다른 단계입니다 주어진 환자군을 찾는데 도움이 될 수 있습니다 해당 결과에 대한 해당 데이터 그리고 우리가 이것에서 나오기를 희망하는 한가지 그게 아니라 수십 또는 수백 명의 환자를 돌보는 대신 임상 연구마다 우리는 이것을 실제로 확장 할 수 있습니다 수천 명의 환자와 그 이상

전체적으로 이것은 환자 구조 데이터 실제로 결과 구조화 된 데이터로 병원에서 데이터를 정리하지 않는 방법입니다 지금 하지만 이제는 이것이 정말로 흥미 로워지기 시작합니다 일단이 환자 집단이 있으면 이 전반적인 개요는 여기에 있습니다 우리가하는 일은이 데이터를 클라우드로 보내는 것입니다

Google Cloud에 구축중인 Google 플랫폼의 구성 요소 플랫폼 여기에 자동화 된 대규모 바이오 마커 발견 신호에 대한 증거를 찾는 과정 문제의 결과와 관련된 데이터 현재 목표는 찾지 않는 것입니다 매우 정확한 분류 기준은 아직 있지만 실제로는 그 증거에 대한 통계적 검증을 제공한다 그러한 신호에 대해서

그리고이 발견 과정은 전적으로 임상의가 주도했다 그 당시 AI 관련 전문 지식은 없었습니다 그리고 이것은 임상의가 이것은 반복적 인 과정입니다 예를 들어, 먼저 시도해보십시오 저선량 CT를 기반으로 한 결과를 예측할 수 있습니다

아주 일찍 찍혔지만, 나올지도 모른다 저용량 CT에서 당신은 단지 당신이 찾고있는 이런 종류의 정보를 가져라 이 방법을 사용하면 다른 반복을 매우 쉽게 수행 할 수 있습니다 나중에 찍은 CT를 가져 오지 않는 곳 치료의 연속체에서 우리가 충분히 만족하면 우리의 데이터에 그러한 증거가 있다면 플랫폼의 협업 측면 들어올 수 있어요

즉, 우리는 다른 임상의들과 협력 할 수 있습니다 환자 기반을 확대하기 위해 다른 병원에서 더 많은 하위 집단이보다 철저하게 다루어 지도록해야합니다 또한 AI 연구원, AI 전문가, 고도로 최적화 된 분류기를 만들기 시작합니다 그 바이오 마커는 해당 바이오 마커의 검출기입니다 일단 이것이 이루어지면 – 이것은 범위를 벗어난 부분입니다

이 이야기의 productization 프로세스는 실제로 생산 될 수 있습니다 결국 임상 적으로 생성 된 바이오 마커 환자 진료에 진정으로 영향을 줄 수 있습니다 그래서 내가 조금 더 가도록 허락한다면 이 발견 프로세스가 어떻게 생겼는지 자세히 설명합니다 조나단이 이미 말했듯이 radiomics라고 불리는 분야의 최근 발전에 기초하여, 아이디어는 이미지 특징을 사용하는 것입니다 직접적으로 추론하기 위해 인간의 눈에 숨겨져있다 환자 결과

이를 위해 영상 데이터를 결과와 함께 가져옵니다 정보를 Google Cloud에 추가하십시오 예를 들어, 우리는 미리 임신 한 간의 이미지를 가지고 있습니다 하지만 이것은 실제로 표현에 불과합니다 더 큰 환자 데이터 세트의 그 다음에 우리는 사전 훈련 된 독립 피쳐 추출기를 해당 데이터에 통합합니다

이러한 기능에 대한 가능한 예는 다음과 같습니다 추출기는 모델이 될 수 있으므로 아이디어를 제공합니다 까다로운 문맥을 가진 얼룩을 찾는 또는 줄이 많이 들어간 입방체 그러나 이러한 모든 기능 추출기, 그들은 결과가 구체적이지 않습니다 그들은 모든 종류의 결과에 사용될 수 있습니다

그리고 거기에는 수천 개가 있습니다 우리 모두가 적용하는 모든 기능 추출기 입력 데이터의 모든 항목에 적용됩니다 각 기능 추출기는 나중에 우리에게 선물 할 것입니다 개인적인 결과와 함께 우리는 여기 다채로운지도가 있습니다

조금 더 잘 보여줄 수 있습니다 그러나 결국 이들은 숫자 값일뿐입니다 지속적인 규모로 이러한 결과는 모두 집계되며, 이 기능을 사용하면 일련의 기능을 찾을 수 있습니다 이는 문제의 결과와 가장 관련이있다 그리고 이러한 일련의 기능들은 예비 바이오 마커입니다

그리고 다시 말씀 드리 자면, 목표는 실제로 여기에 있습니다 그러한 신호의 증거를 찾는 것 반드시 해당 기능에 해당하는 것은 아닙니다 가능한 정확도 약간의 기술적 인 왜곡을주기 위해 우리는이를 Google Cloud에서 구현했습니다 Google Cloud Storage에 데이터를 업로드합니다

우리는 전면에서 프론트 엔드를 운영합니다 Kubernetes 엔진을 기반으로 모든 데이터를 전송합니다 이 종류의 TensorFlow 모델 중 다수에 또는 Kubernetes를 사용할 수있는 다른 종류의 추출기 엔진 또는 구름 기능 여기에있는 아이디어는 실제로 확장 성을 사용하는 것입니다 우리는 이것에서 빠져 나옵니다

따라서 이러한 양의 계산을 실행하는 주문형 확장 성이 있어야합니다 그리고 그 결과를 위해 우리는 우리의 분석을 실행하고 그 결과를 되돌려주는 BitQuery 임상의에게 이제 우리가 피쳐 추출기와 모델에 대해 말할 때, 임상 적 맥락에서, 의료 데이터에 대한 몇 가지 특색이 있습니다 하나는 정말로 알고 있어야합니다 다른 데이터입니다

우선, 우리는 고도로 불균형적인 데이터 세트를 가지고 있습니다 그것은 우리가 건초 더미에서 바늘을 찾고 있다는 것을 의미합니다 그래서 조나단은 선별의 예를 언급합니다 우리는 몇 명의 환자를 찾고 있습니다 매우 많은 인구가있는 질병의 영향을받습니다

그리고 이것은 드문 질병에 대해 더욱 악화됩니다 또한 우리가 예측하려고하는 것 사람들을위한 잠재적 인 치료 효능이다 표준 치료는 효과가 없을 것입니다 그래서 그보다 드문 경우입니다 또한, 우리는 대용량 데이터에서 아주 작은 병변을 다루고 있습니다

예를 들어, 폐색전증의 예를 들자면, 여기에 하나가 있습니다 솔직히, 이것은 약간의 회색 사진이다 많은 더 많은 회색 픽셀로 쉽게 찾을 수있는 것이 아닙니다 설상가상으로이 데이터는 두 가지가 아닌 3 차원 또는 4 차원의 경향이있다 종단 연구용

그래서 많은 표준 기계 학습 전처리 단계, 데이터 축소와 같은 당신은 모든 정보를 거의 잃어 버리기 때문에 작동하지 않을 것입니다 설상가상으로 우리는 데이터에 많은 변동성이 있습니다 특정 기능, 특정 상황 ~에 따라 다르게 나타날 수있다 나이, 인종, 성별, 유전자형뿐만 아니라 성병 환자의 예를 들어, 우리는 심사 과정에서 비 흡연자를 찾는 것 그러나 우리가 주로 흡연자와 함께 모델을 훈련하면, 대부분이 특정 2 차 증상을 나타낼 수 있습니다

폐기종과 같은 그래서 우리는 우리의 모델이 단지 폐기종에 데려가지만, 정말 간다 우리가 찾고있는 것 그리고 장치 별 유물이 많이 있습니다 이 이미지들

그래서 우리가 여기에서 볼 수있는 것은, 이것은 이미징 모달이 실제로 어떻게 이미지를 얻습니다 MRI의 경우, 우리는 교란을 다루고 있습니다 자기장에서 이것은 단지 시각적 표현 일뿐입니다 인간의 소비를 위해

실제 물리적 데이터에서 진행하는 프로세스 시각적 인 자료에, 이것은 제조자 특정한, 그것들은 우리가 설명 할 필요가있는 인공물입니다 다행히도, 우리는 도구 없이는 남아 있지 않습니다 그래서 우리는 커리큘럼이라는 메커니즘을 매우 자주 배치합니다 예를 들어, 작은 병변을 다루는 학습 또는 불균형 한 데이터 커리큘럼 학습의 배경 당신이 정말로 모델로 시작한다는 것입니다

매우 작은 하위 집합에있는 데이터를 패치합니다 그리고 모델이이를 알게되면, 우리는 지속적으로 금액을 늘린다 데이터에 대해 모델에 표시 할 컨텍스트의 양 불균형 데이터 세트에서도 마찬가지로 작동합니다 균형 잡힌 데이터 세트로 시작할 수 있습니다

비트별로 불균형으로 이동하십시오 다양성을 설명하고 특정 아티팩트를 렌더링하기 위해, 우리는 단지 충분한 데이터를 가지고 있어야합니다 우리의 데이터 세트에서 이러한 모든 문제를 충분히 나타낼 수 있습니다 하지만 내가 얻으려고하는 것은 우리가 많은 데이터를 처리하고 우리는 모델을 다루고 있습니다 깊이 있고, 복잡하며, 배우는 데 오랜 시간이 걸립니다

그리고 이것이 우리를위한 이유 중 하나였습니다 이 문제로 인해 Google Cloud로 이동하려면 여기를 클릭하십시오 물론, 우리는 가까운 무한대를 사용할 수 있습니다 자원의 양 그리고 특히 우리에게는 TensorFlow, ML 엔진, TPUs, 이 전체 스택이 정말 잘 작동합니다

모델의 복잡성을 해결하기 위해 우리는 데이터 병렬과 모델을 모두 얻었 기 때문에 병렬성과 합리적으로 낮은 노력 이제, 내가 특징 추출기에 대해 이야기 할 때 이 발견 과정에 대해 임상의가 사용하며, 나는 그들이 사전 훈련 된 모델이라고 언급했다 물론 질문이 제기됩니다이 모델들은 어떻게 훈련 받았습니까? 그들은 어떻게 지어 집니까? 인공 지능 전문가가 임상의와 어떻게 협력 할 수 있습니까? 이러한 기능 추출기를 작성 하시겠습니까? 그리고 이것은 독점적 인 플랫폼의 사용 사례 중 하나입니다 우리는 Evidens라고 부릅니다

추가 정보 임상 데이터로 작업 할 때, 확신합니다 건강 관리에서 일하는 여러분 모두 알고 있습니다 임상 데이터 작업은 고도로 규제됩니다 규제 프레임 워크 중 일부는 HIPAA, 현재 GDPR입니다

건강 캐나다에는 그들 자신이 있습니다 그리고 저는 철저한 개요를 드리고 싶지 않습니다 나는 법적 조언을 줄 수 없다 하지만 그것이 우리에게 달려있는 것은 이것입니다 우선, 우리는 물론 데이터를 익명화해야합니다

예를 들어, HIPAA는 목록을 제공합니다 데이터가 제거되기 전에 제거해야하는 필드 병원 구내를 떠나라 그리고 우리는 익명 성명을 적용 할 필요가 있습니다 데이터의 식별 불능화 임의의 식별자를 할당하는 것을 의미합니다

오리지널 병원에서 생성 된 것을 사용하는 것이 아닙니다 그러나 그것은 거기서 멈추지 않습니다 임상 연구를위한 데이터는 환자 동의 및 기관 승인을 기반으로 사용해야합니다 IRB ERB가 있습니다 제도 또는 윤리 심의위원회 어떤 사람이 살고 있느냐에 따라

그리고 그들은 임상 연구를위한 윤리 승인을 부여합니다 이 동의와 그 승인의 문제점 그것들이 취소 될 수 있다는 것입니다 그래서 한 환자가 병원에 ​​들어갈 수있었습니다 예, 동의했습니다 이 기술적 인 연구를 위해, 그러나 나는 나의 마음을 바꿨다

그리고 그러한 해지의 경우, 우리는 환자의 데이터를 삭제할 수 있어야합니다 또한 안전 측면에서 파생 데이터의 모든 종류가 될 수 있습니다 이것은 내가 CT 스캔을 한 것처럼 간단 할 수 있습니다 나는 그것을 자르고이 작물을 저장했다 그러나 이것은 또한 좀 더 복잡 할 수도 있습니다

특히 기계의 맥락에서 모델이 가중치로 표시되는 학습 가중치는 환자의 데이터에 의해 영향을받습니다 훈련 과정에 들어갔다 이제 자동 인코딩 장치와 같은 모델에 대해 생각해 보면 그리고 생성적인 모델들, 그것이 존재하지 않는다는 것을 보장하는 것은 어렵다 그 환자에 관한 몇 가지 상세한 정보 재생성을 허용하는 모델 내부 환자의 데이터

그래서 안전한쪽에 있기 위해 우리는 말했다 우리는 심지어 그러한 가중치들을 삭제하려고합니다 철회 물론, 수단을 취소 할 수있는 것은 우리는 실제로이 모든 것을 처음부터 추적해야합니다 모든 환자에게 우리가 무엇을 알고 있는지 확인해야합니다

클라우드에서 자신의 데이터에 일어난 일입니다 그리고 이것은 단순히 데이터를 의미하지 않습니다 일단 업로드되면 이후 처리도 우리가 데이터에 적용 할 수있는 단계 그리고 우리가 이것을 성취하는 방법에 대한 상당히 높은 수준의 개요를 제공하기 위해 GCP에서 – 우리는 병원에서 병원으로 데이터를 업로드합니다 Google은 데이터 수집 프로세스를 실행하여 해당 데이터를 가져옵니다

데이트 호수에 그러나 어떤 종류의 작업이 일어나기 전에 데이터에 대해 우리는 항상 우리는 추적 로그 항목을 생성합니다 환자는 어떤 데이터가 완료되었는지 우리가 처음 클라우드에서 실행하는 모든 종류의 데이터 처리 전용 데이터 세트를 만들면 Google을 만들게됩니다 Google의 데이터에서 데이터를 복사하는 Cloud Storage 버킷 호수 하나의 과정을 확인하지 이 데이터에 액세스 할 수 있습니다

이것은 실제로 매우 안전한 데이터 저장소입니다 아무도 접근 할 수 없다 모든 프로세스에 대해 전용 데이터 세트를 생성합니다 이것은 우리에게 매우 쉽게 추적 할 수있는 것입니다 그리고 이것이 신뢰성있게 작동한다는 것을 보여주는 것은 쉽습니다

이 데이터 세트로 들어가는 것만 데이터 처리 단계에서 액세스 할 수 있습니다 데이터 처리, 이것은 이미지 처리, 모델 훈련, 이런 건 데이터 처리로 생성되는 모든 종류의 출력 자르기 이미지 또는 모델 가중치와 같은 단계, Google Cloud Storage 버킷에 들어가기 그 작업을 위해 특별히 생성 된 다시 그 자체로 모든 입력 데이터에 대한 링크입니다 충분히 추적된다 그래서 우리는 정말로 추적 성 체인을 가지고 있습니다 전체 시스템 전반에 걸친 환자 데이터의 모든 비트로부터 우리가 저장하는 모든 종류의 결과

내가 조금 더 가도록 허락한다면 이 퍼즐의 첫 번째 조각에 대한 세부 사항으로, 데이터 섭취, 첫 번째 단계는 전제로 일어난다 우리는 코호트를 받고 그 다음에 병원 고유의받은 편지함에 업로드합니다 우리는 서비스 계정을 사용할 수 있습니다 그러한 것은 병원에만 해당됩니다 따라서이 병원 만이받은 편지함에 액세스 할 수 있습니다

Google은 데이터 수집 프로세스를 통해 데이터를 복사합니다 확인한 후에 만 ​​데이터 호수에 적절한 추적 로그 항목이 작성되고 있는지 확인하십시오 우리가받은 편지함에도 한 가지 우리는 모든 삭제 규칙을 만들었습니까? 환자 해지 요청이 들어올 때, 너는 일정한 양의 시간을 가진다 해당 요청을 준수해야합니다 그리고 우리는 처음부터 실제로 구축하고 견고하게 만들려고 노력했습니다

그럼이 취식 기가 실행되지 않으면 어떻게 될까요? 데이터가받은 편지함 버킷에 고아로 저장됩니다 환자 해지 요청이 들어 왔을 때, 이 데이터는 여전히 존재합니다 우리에게는 문제가있을 것입니다 따라서 며칠 후에이 데이터를 삭제하면됩니다 자동으로 그러나 지금, 문제의 진짜 고기에

인공 지능 연구원은 어떻게 우리 플랫폼을 사용할 수 있습니까? 일상적인 일 때문에? 그리고 우리의 목표는 최대한의 유연성을 제공하는 것이 었습니다 AI 연구원들에게 그리고 종종 단일 교육뿐만 아니라, 그러나 여러 단계의 긴 워크 플로 전처리, 훈련, 분석, 시각화 등 그래서 우리는 연구원들이 여전히 데이터에 대한 완전한 제어권을 유지함 추적 성 확보 그리고 우리에 대한 전반적인 생각은 우리가 산을 가지지 않았다는 것입니다

예언자에게, 그러나 산에 선지자에게 우리는 모든 데이터 저장 공간 실행이 일어나고 있습니다 그리고 트레이닝 데이터를 통한 임의의 종류의 프로세싱 단계에서, 무료 처리는 컨테이너 또는 zip으로 캡슐화됩니다 ML 엔진 코드를 포함하는 파일 Google 시스템에 검색어와 함께 제출 데이터 서비스에서이 쿼리를 실행합니다 앞서 언급 한 데이터 패킷을 생성하고, 그것은 훈련에 주어진다

교육은 해당 데이터에서 실행되며 모든 출력을 생성합니다 출력 패킷에 후속 단계에서 후속 사용을 위해 재 수집 그 워크 플로우에서 그리고 다시, 중요한 것 중 하나 이 단계들의 각각 하나,이 화살들 각각 하나 추적 로그의 항목에 따라 처리됩니다 즉, 이 장치 데이터가 데이터에 다시 조사되는 경우에도, 우리는 언제 어떤 원래 환자가 왔는지 알고 있습니다 Google이 사용하는 몇 가지 다른 Google 기술 우리는 훈련 당 또는 과정 당 허용 된 유일한 서비스 계정 이 버킷에 액세스 할 수 있습니다

이렇게하면 모든 교육이 자신이 상상 한 데이터에만 액세스하십시오 그러나 동시에 우리가 보유한 모든 데이터가 교육을 통해서만 접근 할 수 있습니다 데이터에 액세스해야합니다 이렇게 모든 데이터를 연결하면 원래 개별 환자에게 다시 데이터 및 환자 식별자, 우리는 추적 성 요구 사항을 유지할 수 있습니다 조금 더 빨리 시작하기 나는 우리가 조금씩 달리고 있다는 것을 알아 차리고 있기 때문에 짧은 시간

우리는 이것을 사용하기 쉽도록하기 위해이 위에 있습니다 많은 CLI와 프론트 엔드를 만들었습니다 서비스 및 클라우드 기능으로 작동합니다 이러한 워크 플로를 모델링합니다 한 가지 예를 들어 보겠습니다

우리는 대장 내시경 검사, 우리는 대장 내시경 비디오를 프레임을 추출해야합니다 이 프레임을 준비해야합니다 우리는 조명의 유형을 식별해야합니다 이것은 사용 된 것이고, 우리는 이것을 위해 우리 자신의 모델을 가지고 있습니다 그런 다음 임상의가 수동으로 태그를 지정합니다

그리고이 모든 일이 끝난 후에야 우리는 그 때만 코호트를 만들기 시작합니다 우리는 우리가 상대하고있는 것을 알고 있습니까? 그럼, 우리는 코호트를 만들 수 있고, 이것을 훈련에 넣으십시오 그리고이 단계들 각각은이 전체 루프를 겪습니다 이 훈련에서 나온 마지막 모델, 우리는 여전히 모든 비디오를 추적 할 수 있습니다 그 모델에 영향을 미쳤을 수도 있습니다

그리고 물론, 왜 우리가 이 모든 번거 로움을 극복하는 것은 취소 가능성을 보장하는 것입니다 전에 말했듯이, 환자는 병원에 들어가서 말하면, 나는 너에게 동의했다 그러나 나는 내 마음을 바꿨다 나는 당신이 이것을 원상태로 돌리고 싶습니다 우리가 찾아야하기 때문에 전제에서 일어나야 만합니다

식별되지 않은 식별자 그러나 중요한 부분은 실제로 우리는이 요청을 클라우드에 보냈습니다 우리는이 과정을 어디서 부른지를 말합니다 그리고이 프로세스는이 모든 정보를 사용할 수 있습니다 추적 로그에 이전에 저장 한 관련 데이터의 모든 단일 위치를 식별 그 환자의 데이터 레이크에 색인, 양동이 실행 교육, 메타 데이터의 모든 종류

아무것도 삭제할 수 있습니다 삭제됩니다 죄송합니다 보고서가 생성되고 병원에 다시 보냈습니다 이는 요구 사항 중 하나 일뿐입니다

우리는이 전체 루프를 클라우드를 통해 병원으로 다시 전제 이제 바이오 마커 발견 과정으로 되돌아 가며, 물론이 모든 피쳐 추출기 우리가 전에 언급 한 모델은 훈련 된 모델입니다 이 플랫폼을 통해 그것들은 전개되고, 어딘가에서 움직이는 모델이며, 바이오 마커 발견 프로세스에 사용됩니다 그러한 해지의 경우, 이것이 우리가 할 수있게하는 것은 자동으로 재교육하는 것입니다 이 경우 영향을받는 모델 그 한 환자의 데이터없이 방금 해지 요청을 보냈습니다

우리는 이러한 모델을 재교육하여 가능한 모든 모든 정확성 요구 사항 부분 집단은 여전히 ​​만났고, 이 모델을 자동으로 재배포하면됩니다 바이오 마커 발견을위한 지속적인 서비스 보장 플랫폼 그래서 이것은 우리가 오늘날있는 곳입니다 우리가 현재 추구하고있는 지속적인 연구 우리가 정말로 신뢰도를 향상시키고 자하는 것입니다 우리 플랫폼의 우리는 환자를 쉽게 돌보고 싶습니다

우리가 구축하고있는 플랫폼을 신뢰하라 그들이 기여할 때 사람들을 편안하게 해준다 임상 연구 물론,이 시대와 시대에는 아무런 이야기도하지 않습니다 블록 체를 언급하지 않고 들어 올릴 수있다

블록 체인을 사용하는 것입니다 우리가 생각할 수있는 영역 중 하나 블록 체인의 기능을 사용하는 것이 유익합니다 영장을 발급 할 수있는 불변 원장 예라고 말하는 환자와 병원에이 데이터를 받았습니다 또는 해지 요청을 받았습니다 그리고 밖으로 벗어날 방법이 없을 것입니다

오는 책임감 이 데이터 또는 해당 해지 요청 결국, 우리의 모든 문제에 대한 해결책입니까? 아마도 그렇지 않습니다 그리고 청중의 누군가가 어떤 아이디어라도 가지고 있다면, 나는 그 이야기에 대해 이야기하고 싶다 블록 체인으로 모델을 삭제하는 법을 모르겠습니다 무언가가 삭제되었음을 어떻게 보장하나요? 거기에 아무 사본도 남지 않았습니까? 그런 시스템에는 항상 신뢰의 구성 요소가 있습니다 시스템을 신뢰해야하거나 회사를 신뢰해야합니다

또는 규제 기관이나 귀하를 신뢰해야합니다 블록 체인 구현을 신뢰해야합니다 완전히 신뢰없는 시스템? 아니요,하지만 우리는 정말로 신뢰를 향상 시키려고 노력할 수 있습니다 환자와 병원을 위해 우리는 또한 특정 암호화 보장, 프록시 암호화를 통해 암호화를 사용할 수 있다고 말할 수 있습니다

특정 프로세스 만 액세스 할 수 있도록 보장 그들이 액세스해야하는 데이터 그리고 그 다음 단계가 될 수 있습니다 이것은 우리가 정말로 더 참을성있게 해줄 수 있습니다 동의 프로세스를 모델링하여 참여 암호화 보장을 통해 환자가 특정 임상 연구에 특정한 키를 다시 암호화함으로써 또는 수행 할 교육 자신의 키를 가지고 명시 적으로 동의를 나타낼 수 있습니다 그 임상 연구에

우리는 데이터와 데이터의 맥락에서 많은 이야기를 해왔습니다 주로 환자 데이터에 관한 것이지만 더 많은 정보가 있습니다 이러한 모든 동의 및 승인, 그들은 그들 자신과 연관된 데이터를 가지고있다 그것들은 형태, 과정이며 우리는 이것을 모델링하고 싶습니다 정말로 줄 수있는 각기 다른 프로세스의 총체적인 엔드 투 엔드 추적 성을 고려하여 임상 현장에 참여하고 있으며, 클라우드의 데이터 및 취소 가능성 등이 있습니다

그리고 우리는 특정 지역이 있다고 믿습니다 클라우드의 중앙 집중식 학습 적합하지 않거나 심지어 불가능할 수도 있습니다 예를 들어, 기계 학습 작업을 실행하려면 그렇지 않으면 얻을 수있는 정보가 필요한 데이터 익명화 프로세스를 통해 제거, 클라우드에서 이것을 실행하는 것은 거의 불가능합니다 그래서이 몇 가지 경우에 우리는 찾고 있습니다 데이터가 전제에 머무를 수있는 연합 학습으로 우리는 통제권 만 클라우드에 유지합니다

물론 이것은 덜 바람직한 접근 방식입니다 하드웨어 유지 보수 및 이러한 모든 골치 아픈 일을 할 수 있습니다 조나단에게 돌아 가라 Jonathan KANEVSKY : 래리 리드 박사가 60 년대의 여행에서 그의 머리까지 그것이 얼마나 중요한지의 복잡성으로 회전 할 것입니다 우리가 생각하고있는 것들에 대해 생각하는 것입니다

그러나 궁극적으로 요약하면 우리는 당신과 공유하고 싶었습니다 이 협업 생태계 – Google 클라우드를 기반으로합니다 우리는 건강 전문가, 엔지니어링 전문가들은 그들이 할 수있는 방법이 아니라 건강 전문가없이 AI 사용 AI에 대한 지식이 없어도 AI를 사용할 수 있습니다 하지만 큰 영향을 미치는 척도로 그렇게하는 것 대규모 네트워크에서 시간 내 주셔서 대단히 감사합니다 궁금한 점이 있으면 기꺼이 답해 드리겠습니다

[음악 재생]