How to Make a Data Science Project with Kaggle

YUFENG GUO : "Cloud"에피소드 인공 지능 모험, "나는 메간 Risdal을 초대했습니다 쇼에서 나와 함께하기 함께, 우리는 Kaggle에서 우리 자신의 데이트 과학 프로젝트를 요리 할 것입니다

오늘 어떠니, 메간? 메간 리달 : 잘하고 있어요 너의 쇼에 나를 갖게 해줘서 고마워 YUFENG GUO : 굉장합니다 그리고 우리가 가기 전에, 나는 당신이 무엇에 대해서 이야기 할 기회를 갖게 해줄 수 있어요 당신은 Kaggle과 당신의 역할을합니다

메간 리 다르 : 물론 그래서 나는 Kaggle의 데이터 세트의 제품 책임자입니다 이것이 의미하는 것은 제가 엔지니어들과 함께 일한다는 것입니다 우리의 디자이너뿐만 아니라 우리의 커뮤니티 데이터 과학자들이 발견 할 수있는 도구를 만들기 위해, 공유 및 분석 할 수 있습니다 그리고 오늘, 우리가 원하는 것은 Kaggle을위한 것입니다

170 만 데이터에 가장 적합한 장소 과학자들이 데이터 과학을 공유하고 협력한다 프로젝트 YUFENG GUO : 굉장합니다 그리고 오늘, 우리는 함께 일할 것입니다 가장 신선한 재료를 사용하는 것 – 메간 리 다르 : 데이터

YUFENG GUO : 다른 도구를 사용하여 준비하십시오 우리의 맛있는 결과를 만들기 위해 함께 일합니다 이 공용 데이터 세트 및 노트 시원한 분석을 가진 세계와 공유 할 수있다 그것과 함께 갈 것입니다 그래, 그래

맞습니다 오늘 정말 기쁩니다 왜냐하면 우리는 정말로 이것은 공동 프로젝트입니다 그래서 그것이 우리가 일을 끝내는 방법입니다 팀워크

YUFENG GUO : 팀웍 괜찮아 가자 그래서 메간은 이전 에피소드에서 "AI Adventures" 얻는 방법을 보여주는 동영상을 보았습니다 Kaggle 커널로 시작되었습니다

그리고 시작하기 만하면 매우 초보적이었습니다 그것은 굉장합니다, 그것은 자유로운 자원입니다 하지만 그 이후로 몇 가지 새로운 기능이 출시되었습니다 그것은 정말로 Kaggle의 기능을 향상시킵니다 사용되는 커널과 데이터 세트 모두 개인 및 팀을위한 훌륭한 도구입니다

MEGAN RISDAL : 네, 맞습니다 그래서 오늘, Kaggle는 정말로 멋진 장소입니다 R 및 Python을 사용하여 데이터 작업을하는 사람들에게 유용합니다 그들은 정말로 데이터 과학 포트폴리오를 구축하고 있으며, 데이터 분석 작업을 수행하거나 연구를 공유 할 수도 있습니다 데이터 과학을 수행하는 데는 많은 도구가 필요합니다

그리고 Kaggle은 실제로이 원 스톱 상점으로 활동합니다 이러한 모든 도구를 제공하는 데이터로 작업하는 것을 가능하게합니다 개인적으로, 그것을 세계와 공유하는 것 YUFENG GUO : 그리고 그것은 정말로 – 정말 환상적입니다 사실에 대해 좀 더 살펴 보겠습니다

Kaggle 데이터 집합과 커널이 지원할 수 있음 이런 종류의 공동 모델,이 개인 모드, 당신이 원한다면 MEGAN RISDAL : 최근의 몇 가지 기능 개인 데이터 세트를 게시하고 작업 할 수있는 능력 및 커널 커널에 관해서는 기본적으로 클라우드의 랩톱처럼 노트북보다 강력합니다 내가 오늘 여기에서 일하고있다

RAM 16 개, CPU 4 개, 계산 시간 6 시간입니다 그리고 정말 흥미 진진한 것들 중 하나 그것은 도커 컨테이너에 모두 있다는 것입니다 데이터 과학자들이 좋아하는 모든 패키지가 들어 있습니다 사전 설치 따라서이 환경을 한 번 클릭하면됩니다

그리고 마지막으로 더 많은 사용자 정의를 추가하기 시작합니다 그래서 누락 된 패키지가 있다면, GPU를 설치하거나 GPU를 추가 할 수 있습니다 YUFENG GUO : 오우 그래, 그래 YUFENG GUO : 매우 좋습니다

오늘 특정 데이터 세트를 선택했습니다 로스 앤젤레스시의 데이터 주변에서 놀아 라 내가 제대로 이해한다면 MEGAN RISDAL : 네, 맞습니다 그래서 많은 정부와 기관들이 전 세계와 미국에서 열린 데이터를 부분적으로 이용 가능하게 만들고있다

그들의 오픈 데이터 이니셔티브를 그들의 작품은 더욱 투명합니다 그래서 나는 로스 앤젤레스 출신이다 나는 로스 앤젤레스에 살고있다 그리고 나는보기에 관심이 많았습니다 로스 앤젤레스 시가 공개 한 데이터 중 일부는 사용할 수 있습니다

그래서 나는 오픈 데이터 포털을 둘러 보았습니다 이 사람이 내 눈에 들어왔다 왜냐하면 나는 약간의 foodie 좀 재미 있어요 하지만 실제로 환경 보건법 위반입니다

로스 앤젤레스의 레스토랑과 시장에서 YUFENG GUO : 좋습니다 좋아, 들어 가자 네 MEGAN RISDAL : 그래, 내가 한 일 데이터 세트를 다운로드 했습니까? 이제 로컬 컴퓨터에 있습니다

YUFENG GUO : 좋습니다 메간 리 다르 : 그리고 우리가 할 일은 그것을 Kaggle에게 업로드하고 있습니다 이것은 우리 프로젝트의 기초가 될 것입니다 YUFENG GUO : 굉장합니다 그리고 제가 종종 듣는 것들 중 하나는 – 어떤 사람들은 분산되어있는 것에 관심이있다

컴퓨팅 및 방대한 데이터 세트 방금 언급했듯이이 데이터 세트를 다운로드합니다 귀하의 로컬 컴퓨터에 그리고 몇몇 사람들은, 오, 나는 많은 계산과 자원이 필요하다고 말합니다 Kaggle은 유스 케이스를 지원할만큼 강력 할 것인가? 그리고 나는 Kaggle을보고, 당신이 언급 한 활기찬 지역 사회 – 170 만 명이 었나요? 그래, 그래

그게 오늘 우리가있는 곳입니다 YUFENG GUO : 놀랍습니다 사용 사례가 너무 많음을 분명히 보여줍니다 그 밖의 거대한 대규모 데이터 세트를 넘어서 당신이 도망 갈 수있는 상황이 있습니다

아주 먼 곳으로 데려다 줄 수있는 강력한 기계가 하나 있습니다 MEGAN RISDAL : 네, 맞습니다 그래, 우리는 사람들이 수천을 업로드하고있다 한 달에 걸친 데이터 세트 수 YUFENG GUO : 예, 와우 좋아 이제 네 랩탑으로 가자 우리가 그 일을 어떻게 진행하는지보십시오

Kaggle에서 어떻게 새로운 데이터 세트를 만들 수 있습니까? 메간 리 다르 : 물론 그래서 우리는 Kaggle 's의 데이터 세트 페이지에서 시작하려고합니다 웹 사이트 그래서 이것이 어떻게 생겼는지입니다 그리고 기본적으로 이것은 여러분이 가지고있는 곳입니다

공개적으로 공개 된 모든 데이터 세트에 대한 액세스 Kaggle에 게시 됨 그리고 우리는 오늘 우리 자신의 것을 추가 할 것입니다 그래서 저는 새로운 데이터 세트를 클릭 할 것입니다 그리고 여기에서, 그것은 단지 문제입니다 파일 끌어서 놓기 내가 업로드하도록 선택한 그리고 이것들은 Los의 레스토랑과 시장에 대한 검사입니다

앤젤레스와 위반 그리고 나서 약간의 메타 데이터를 추가해야합니다 데이터 세트가 시작되도록합니다 그래서 저는 여기서 필요한 모든 정보를 얻을 것입니다 그래서 우리는 비공개로 유지할 것입니다

왜냐하면 우리가 이야기 한 것처럼 잘 문서화되도록 데이터 세트를 준비하고 싶습니다 그리고 나서 우리도 놀 것입니다 데이터를 조금씩 사용하여 커널을 작성하십시오 공개적으로 공유하기 전에 YUFENG GUO : 네, 대단합니다 그리고 그것은 분명히 얻지 못하는 것입니다

데이터 집합에 대한 문서가 많이 나와 있습니다 MEGAN RISDAL : 네, 맞습니다 YUFENG GUO : 코드의 문서 매우 잘 이해되고 있으며, 사람들은 그 집을 망치고 있습니다 그러나 데이터 세트에 대한 문서는 새로운 개념입니다 MEGAN RISDAL : 맞아

예, 실제로 데이터에 액세스 할 수있게하는 것입니다 데이터 파일 자체를 기계로 읽을 수있게 만드는 것만이 아닙니다 CSV 포맷이 잘되어 있습니다 또한 일하는 데 관심이있는 사람을 도왔습니다 이 데이터는 실제로 그것을 이해합니다

이제 Create Dataset을 클릭하기 만하면됩니다 YUFENG GUO : 환상적입니다 괜찮아 그리고 귀하의 개인 데이터 세트가 성공적으로 생성되었습니다 메간 리달 : 예

YUFENG GUO : 우우 MEGAN RISDAL : 멋지다 이제 개인 데이터 집합이 업로드되었습니다 그리고 그것이 여기에 우리에게 알려주 듯이, 이제 우리는 이미 데이터 세트를 분석하기 시작한 것에서부터 무엇이든 할 수 있습니다 공동 작업자 추가에 이르기까지 그 두 가지를 할 것입니다

YUFENG GUO : 환상적입니다 MEGAN RISDAL : 확인을 클릭합니다 그리고 그것은 우리를 우리의 데이터 세트로 데려 갈 것입니다 YUFENG GUO : 좋아 보인다 그래, 그래

YUFENG GUO : 그건 진짜 같은 것입니다 MEGAN RISDAL : 네, 맞습니다 그래서 우리가 사람들이 창조 할 때하고 싶은 일 개인 데이터 집합을 사용하면 자신이 쉽게 만들 수 있습니다 그런 다음 해당 데이터 세트를 공개하고 공유하십시오 커뮤니티와 그래서 우리는이 품질 체크리스트를 제공합니다

사람들이 기본적으로 데이터 세트를 문서화하는 데 도움이됩니다 그들이 그것을 나눌 때 성공하도록 돕습니다 그래서 우리는 빨리 갈 것입니다 이 품질 체크리스트를 통해 그래서 첫 번째는 설명을 제공합니다 그리고 이것은 단지 마크 다운 파일이므로 여기에 저장했습니다

YUFENG GUO : 좋습니다 네 그게 정말 멋지다는거야 어떤 종류의 것들에 대한 지침 데이터 세트를 멋지게 만들기 위해 추가 할 수 있습니다 MEGAN RISDAL : 네, 맞습니다

YUFENG GUO : 좋은 경험을하십시오 그래, 그래 그래서 저는 이해와 같은 것들을 생각합니다 데이터의 맥락과 흥미로운 이유 왜 그것을 공유하는지가 중요합니다 더 자세한 정보를 제공 할뿐 아니라 해당 데이터 세트의 내용에 대해 그래서 그것이 우리가 여기에서 한 것입니다

그리고 영감도 – 그래서 몇 가지 질문을하면 데이터를 사용하여 대답 할 수 있습니다 YUFENG GUO : 네 거기서 다른 데이터 세트를 보았습니다 이제 나는 왜 [부적절한], 거기에 어떤 지침이 있음을 안다 MEGAN RISDAL : 맞습니다

네 그럼이 페이지의 다음 일은 우리는 몇 개의 태그를 추가 할 것입니다 일단 데이터 세트가 검색되면 데이터 세트를 더 쉽게 찾을 수 있습니다 공개적으로 공유 할 준비가되었습니다 그래서 우리는 공중 보건과 음식과 음료를 할 것입니다

YUFENG GUO : 합리적인 것 같습니다 MEGAN RISDAL : 합리적인 것 같습니다 그러면 자막과 배너 이미지를 추가 할 것입니다 그리고 이것은 페인트의 마지막 외투를 추가하는 것입니다 잘 보이게하고 사람들이 이해하도록 돕기 위해 데이터 세트에 관한 것입니다

YUFENG GUO : 예 – 약간의 재능 MEGAN RISDAL : 네, 맞습니다 YUFENG GUO : 좋습니다 MEGAN RISDAL : 그럼 우리가 그걸 살릴거야 YUFENG GUO : 그리고 우리는 그들이이 이미지를 대체하기를 원합니까? 그래, 그래

이것이 데이터 집합 목록에서 Google이 볼 수있는 것입니다 그리고 당신은 그 표지에 의해 데이터 세트를 판단하지 않아도됩니다 그러나 그것이 화려한 이미지를 가지고 있다면 – 오직 도움이 될 수 있습니다 YUFENG GUO : 예 나는 항상 얇게 썬 양파의 이미지가있는 데이터 세트를 선택합니다

그렇지 않은 사람 MEGAN RISDAL : 맞습니다 맛있어 보인다 그리고 마지막으로, 가장 중요한 부분 나는 당신을이 데이터 세트의 공동 작업자로 추가 할 예정입니다 YUFENG GUO : 그래서 지금 나는 그것을 보게된다? 그래, 그래

YUFENG GUO : 좋습니다 그래서 결국 – MEGAN RISDAL : 당신이 계십니다 편집 권한을 부여합니다 YUFENG GUO : 감사합니다 Megan Risdal이 데이터 집합을 편집하도록 초대했습니다

큰 그리고 Kaggle에서보기를 클릭 할 수 있습니까? 그래, 그래 YUFENG GUO : 그리고 그 모습을 보자 굉장해 그래서 이것은 당신 편에서 본 것과 기본적으로 같습니다

MEGAN RISDAL : 네, 맞습니다 시원한 그래서 우리는 우리의 데이터를 업로드하고 문서화했으며, 너와 그걸 나눠 봤어 우리가 사람들에게하도록 권하는 것들 중 하나 코드를 통해 데이터 세트를 문서화하는 것입니다 그래서 내가 말하는 것은 출판입니다

데이터 세트의 커널은 사용자에게 시연 할 수있는 한 가지 방법이며, 지역 사회의 다른 사람들, 그들은 당신의 데이터로 할 수 있습니다 그래서 우리는 누군가를 커널에 보여주고 싶을 것입니다 데이터를 읽는 방법, 일부 데이터를 읽을 수있는 방법 데이터를 사용하여 시각화 할 수있는 질문, 질문 그것을 사용하여 답변을 얻을 수 있습니다 YUFENG GUO : 네 요즘 Kaggle에서 데이터 세트를 볼 때, 그들 모두는이 탐험 수첩을 가지고있다

환상적인 시각화를 사용하면 정말 좋습니다 그래, 그래 예 바로 그 거예요 새로운 데이터 세트 작업을 시작할 때, 보통, 당신이 지역에서 일할 때, 커서가 깜박이기 시작합니다 당신에게 보여주는 코드가 없습니다

데이터를 읽는 방법과 데이터로 작업하는 방법 그래서 우리가하려고하는 것은, 데이터 세트를 추가로 문서화 할 것입니다 커널을 게시하여 YUFENG GUO : 환상적입니다 메간 리 다르 : 시작합시다 이 빅 블루 버튼을 클릭하기 만하면됩니다

우리가 부르는대로 – 새로운 커널 YUFENG GUO : 예 MEGAN RISDAL : 여기서는 스크립트 사이에서 선택할 수 있습니다 및 노트북 내가 좋아하기 때문에 나는 노트북과 함께 갈거야

인터리빙 마크 다운 및 코드 그리고 나서 이것이 시작되는 동안, 나는 할 수있다 내가 접근 할 수있는 데이터를 가지고 있는지 보아라 여기 내 환경에서 내 손가락 끝에 YUFENG GUO : 좋습니다

MEGAN RISDAL : 저는 언어를 바꿀 것입니다 R 저는 Stats 사람입니다 맞습니다 YUFENG GUO : 좋습니다

MEGAN RISDAL : 멋지다 내가 한 일은 내가 바람을 피웠다는 것입니다 이미 코드를 준비했습니다 내가 사용할거야 그래서 저는 여기서 그것을 빨리 업로드 할 것입니다

그리고 나서 내가 너를 걸을거야 데이터 세트를 분석하기 위해 수행되었습니다 YUFENG GUO : 좋습니다 메간 리 다르 : 그래서 첫 번째 셀에서, 검사 CSV 파일과 위반 CSV 파일이 있습니다 그래서 나는 그 사람들을 읽고 그것에 참여할 것입니다

함께 일련 번호를 기입 한 다음 결과 데이터 프레임을 엿볼 수 있습니다 YUFENG GUO : 좋습니다 메간 리 다르 : 그렇게되면, 우리는 거의 900,000 개의 레코드를 가지고 있음을 알 수 있습니다 우리가보고있는 것 그래서 이들은 모두 건강법 위반입니다

약 2 년간의 데이터 YUFENG GUO : 좋습니다 2 년 동안은 그렇게 많이 남아 있습니다 MEGAN RISDAL : 그래, 그게 그 것처럼 보인다 그래서 우리는 그 모습을 파헤칩니다 이제 데이터 세트를 준비 했으니 까 내가 원하는 모양으로, 위반의 수를 봅니다 월별로보고 됨

YUFENG GUO : 맞습니다 이것은 큰 것입니다 그래, 맞아 괜찮아 YUFENG GUO : 좋습니다

MEGAN RISDAL : 그래서 당신은 그것이 얼마나 빠르고 빠르는지 알 수 있습니다 그리고 우리는이 시각화를 가지고 있습니다 우리 앞에서 그래서 그것은 많은 건강법 위반입니다 YUFENG GUO : 네

그것은 온통 여기에 있습니다 어떻게 생겼는지 바는 무엇입니까? 30,000? MEGAN RISDAL : 네, 맞습니다

YUFENG GUO : 한 달 안에? 메간 리 다르 : 네 네 YUFENG GUO : 그것은 두더지입니다 메간 리달 : 네 자, 계절 추세가 있는지 살펴 봅시다

또한 위반 사항에 대한 정보도 있습니다 일련 번호마다 그래서 우리는 그것을 살펴볼 것입니다 그리고 우리는 상위 10 개를 살펴볼 것입니다 위반 사항이 있으므로이 코드가 여기에서 수행 될 것입니다

YUFENG GUO : 우리는 그것을 실행하고 우리는 다음과 같이 갈 것입니다 – 와우, 아주 좋은 색상의 코딩이 여기 있습니다 저 더 어두운 사람이 더 많거나 더 가벼운 사람은 더? 메간 리 다르 : 라이터가 더 밝습니다 YUFENG GUO : 좋습니다 그래, 그래 네, 여기 이걸 볼 수 있어요

바닥, 벽, 천장은 제대로 건축되고, 유지되고, 잘 수리되고, 깨끗하게 YUFENG GUO : 좋습니다 그래, 그래 YUFENG GUO : 항상 유감스럽게 생각합니다 귀하의 시설이 잘 수리되고 있는지 확인하십시오

MEGAN RISDAL : 네, 맞습니다 그리고 마침내, 나는 단지 저장하려고합니다 나중에 염두에 두어야 할 또 다른 프로젝트는 우편 번호로 위반 사항을보고 싶습니다 그래서 우리는 각 시설에 대한 정보도 얻었습니다 그들의 주소는이다

그래서 우리는 그곳에 우편 번호와 표정에 의한 위반이 더 많다 지형 공간 분석에서 하지만 나중에 조금하고 싶습니다 CSV를 파일로 작성하려고합니다 그리고 나는 그것을 다른 커널에서 사용할 수있을 것이다

YUFENG GUO : 맞습니다 그리고 당신은 상상할 수 있습니다 나는이 새로운 산출물에 대해서 생각하려고 노력하고있다 당신이 만든 것, 당신은 어떤 종류의 매핑을 만들 수 있습니다 그것으로

멋진 색으로 구분 된 히트 맵 중 하나를 수행 할 수 있습니다 MEGAN RISDAL : 네, 그렇습니다 YUFENG GUO : 우리는 이런 종류의 히트 맵을 가지고 있습니다 유형별로 위반 사항을 보여 주지만, MEGAN RISDAL : 그래, choropleth지도 지형 공간처럼 – YUFENG GUO : 혀 트위스터가 있습니다 메간 리 다르 : 예, 전성기

네, 정확히 말하면, 지금, 어떻게이 데이터 세트를 엿볼 수 있을까요? 이미 새로운 질문에 영감을 불어 넣었습니다 이것이 바로 사용자를 위해 우리가하고 싶은 일입니다 그래서 나는 내 노트에 제목을 부여 할 것입니다 YUFENG GUO : 예, 항상 제목이있는 것이 좋습니다 그래, 그래

그런 다음 커밋하고 실행합니다 YUFENG GUO : 좋습니다 그러니 그걸 치자 그게 실행되는 동안, 당신을위한 질문 – 너라면 노트북을 구할 수 없어? 커밋 및 실행을 클릭하지 않았습니까? 클릭하기 전에 해당 탭을 닫으려면, 그 모든 코드에 무슨 일이 일어날 것인가? MEGAN RISDAL : 초안을 저장하고 있습니다 하지만 코드를 저장하려면 나중에 다시 돌아와 다른 사람들과 공유하십시오

당신은 Commit and Run을 치고 싶다 그리고 그것은 코드를 위에서 실행합니다 바닥에 YUFENG GUO : 맞습니다 완전한

한 번 끝나면 다음 단계는 무엇입니까? 우리 계획은 여기서 뭐지? 왜냐하면 지금 당장 우리는 비공개이지만 우리 사이에 공유되는 데이터 세트가 있어야합니다 우리는 여전히이 커널을 가지고 있다고 생각합니다 너에게 개인적으로, 맞지? MEGAN RISDAL : 그래, 일단 이것이 끝나면, 계속해서 스냅 샷보기를 클릭하겠습니다 그리고 이것은 우리를 노트북 뷰어로 데려 갈 것입니다 그리고 여기에서, 이것은 내가 세상과 나눌 것입니다

그리고 이것은 누군가가 데이터 세트를 보는 것입니다 찾을 수 있습니다 그래서 나는 앞으로 나아갈 것이고, 다시 당신과 이것을 나눌 것입니다 당신이 우리의 모든 일이 공개 될 준비가되었습니다 YUFENG GUO : 맞습니다

예, 팀 환경에서, 당신은 근본적으로 일종의 코드 리뷰를하기 위해 이것을 할 수있다 대본 그래, 맞아 YUFENG GUO : 좋습니다 그러니 일단 끝내면 내 노트북에서 이쪽으로 갈 수 있습니다

데이터 세트에서 커널을 클릭하고 이동합니다 당신의 일에, 나는이 경우에 당신의 일이라고 생각합니다 MEGAN RISDAL : 맞아 YUFENG GUO : 여기 노트북을 열어 드리겠습니다 그리고 여러분은 그것이 잘로드되어 있음을 볼 수 있습니다

그리고 노트북을 편집하거나 포크 할 수있는 옵션이 있습니다 그래, 그래 그럼 어째서 그 일을 포기 하렴 모든 것이 예상대로 실행되는지 확인하십시오 그리고 모든 것을 컴파일 할 수 있습니다

YUFENG GUO : 내가 그것을 포크로 할 때, 그런 다음 GitHub에서 저장소를 포크 할 때와 비슷합니다 MEGAN RISDAL : 맞아 YUFENG GUO : – 당신은 당신 자신의 복사본을 만들 수 있습니까? 자, 이건 내거야? 그래, 그래 이것은 코드뿐만 아니라 코드의 사본이기도합니다 내가 사용한 데이터와 내가 사용한 환경

YUFENG GUO : OK, 잡았다 그리고 지금은 아무 것도 당신 편에 변화를줍니다 내 사본에 영향을 미치지 않습니다 MEGAN RISDAL : 맞습니다 YUFENG GUO : 좋습니다

자, 이제 실행하고있어 다른 커널을 생성한다 이름을 변경해야합니까? 내가 그대로두면 거기에 이름 충돌이있을거야? 메간 리 다르 : 당신은 그것을 바꿀 필요가 없습니다 그래서 사용되는 민달팽이는 사용자 이름이고, 노트북 제목의 슬러그 YUFENG GUO : 잡았다

그래서 나는 그것을 바꿀 수 있었지만 그렇게 할 필요는 없다 MEGAN RISDAL : 맞아 YUFENG GUO : 자, 제가 다시 가면 오, 우리는 그것이 그것을하는 것을 볼 수 있습니다 내 포크를 다른 사람들과 공유하십시오 MEGAN RISDAL : 네, 맞습니다 YUFENG GUO : 우리는 우리의 데이터를 볼 수 있습니다 제가 지금 다시 클릭하면, 이것은 – 일단 끝나면 그냥 나타납니다? 메간 리 다르 : 그렇습니다

YUFENG GUO : 그리고 거기에 있습니다 괜찮아 메간 리달 : 굉장해 그래서 당신은 어떻게 생각하십니까? YUFENG GUO : 꽤 좋은, 꽤 좋다 나는이 사실을 현실로 공개 할 때라고 생각한다

메간 리달 : 예, 공개하겠습니다 YUFENG GUO : 좋습니다 MEGAN RISDAL : 멋지다 그래서 데이터 세트로 돌아가겠습니다 그리고 Settings (설정), Sharing (공유)으로 이동하여 준비가되었다고 생각하면, 공개로 만들기를 클릭 할 수 있습니다

YUFENG GUO : 좋아,하자 따라서 이것은 영구 공개됩니다 MEGAN RISDAL : 맞습니다 YUFENG GUO : 좋습니다 그것은 당신이 여기에 들어가는 것을 아는 것이 항상 좋은 것입니다

좋은 메간 리 다르 : 그리고 여기에 우리가 간다 그리고 나서 다음 단계는 물론입니다 커널을 공개하길 원한다 YUFENG GUO : 오, 맞아

커널 자체가 데이터 세트와 분리되어 있기 때문에, 그래서이 두 개념은 구별됩니다 MEGAN RISDAL : 맞습니다 YUFENG GUO : 그래서 이런 상황에서, 네가 물건을 썼던 곳 일 수도 있고, 그리고 당신은 당신의 것을 공개합니다 그런데 나는 그것을 포크로 찍는다 그리고 그것은 사적이다

그리고 나는 너 또는 다른 사람들과 개인적으로 그것을 확장 할 수있다 그리고 아마도 다른 버전을 출시 할 것입니다 몇 가지 다른 분석과 함께 MEGAN RISDAL : 맞아 예 바로 그 거예요

따라서 유연성은 귀하에게 달려 있습니다 YUFENG GUO : 굉장합니다 MEGAN RISDAL : 데이터 측면이 공개됩니다 그리고 데이터 과학자 커뮤니티의 모든 사람 음식점 검사에 대해 더 많은 것을 탐색 할 수 있습니다 로스 앤젤레스 카운티의 위반

YUFENG GUO : 맞습니다 맞습니다 현재 축소 된 내용을 살펴보면, 그것은 아주 조금입니다 그리고 도구는 모두이 패키지에 들어 있습니다 정말 멋지고 완벽한 플랫폼입니다

나는 정말 즐거웠다 그리고 우리는 당신 편에서 노트북과 데이터 세트를 만들었습니다 우리는 개인적으로 공개적으로 공유 할 수있었습니다 그리고 우린 물건에 빠지지도 않았어 댓글 달기 시스템 및 토론 포럼과 같은 그리고 Kaggle에게는 훨씬 더 많은 것이 있습니다

그러나 공동 작업과 공유 환경조차도 너무 부자 야 그래, 그래 그래서 처음부터 끝까지 프로젝트를 만들었습니다 로컬 컴퓨터에서 데이터 파일을 가져 왔습니다 이 재현 가능하고 문서화 된 데이터 세트에 세상과 공개적으로 공유됩니다

그리고 어떻게하면 누군가가 학교 프로젝트에 이것을 할 수있다 또는 연구 공유 방법 YUFENG GUO : 당연히 네 그래서이 노트는 정말로 공개됩니다

그래서이 비디오를보고 있다면, 당신은 지금 Kaggle에 가서이 데이터 세트에 접근 할 수 있습니다 설명에 노트북에 대한 링크가 포함됩니다 동영상 아래에서 공유하고 공유하면됩니다 노트북, 데이터 세트를보고 댓글을 달 수 있으며, 자신의 노트를 포크로 만들고 편집하십시오 오늘 Megan과 함께 해줘서 고마워

이 Kaggle 커널을 조합하는 것은 정말 재미있었습니다 우리는이 데이터 세트를 만들어 전세계에 공개합니다 이 비디오가 마음에 들면 좋아요 버튼을 누르십시오 아래에서 아래로 클릭하고 구독하기를 클릭하십시오 "Cloud AI Adventures"의 모든 에피소드 그들이 나오면 바로

당분간, 나와 메간은 돌아갈거야 이 커널 작업 그러나 이번에는 아마 설득 할 수 있습니다 그녀는 파이썬에서 그것을 할 수 있습니다 메간 리 다르 : 우리는 그것에 대해 알게 될 것입니다

YUFENG GUO : 좋습니다

Google ‘to end’ Pentagon Artificial Intelligence project

구글, '펜타곤 인공 지능 프로젝트'종료 예정 구글 최고 경영자 다이앤 그린 (Diane Greene)은 금요일에 직원들에게 계약 연장이 없을 것이라고 말했다 구글 소식통은 미국 국방부에 인공 지능 업무를 수행하겠다는 계약을 갱신하지 않을 것이라고 밝혔다

이 결정은 거대 기술 인력의 강력한 반대를 따른 것입니다 수많은 구글 직원이 사임했으며 수천명의 사람들이 메이 븐 (Maven)으로 알려진 펜타곤 프로젝트 참여를 반대하는 항의 청원서에 서명했습니다 그들은 치명적인 목적으로 인공 지능을 사용하는 첫 번째 단계라고 우려했습니다 Google의 공식 성명은 발표되지 않았습니다 회사 소식통에 따르면 다이앤 그린 (Diane Greene) 최고 경영자 (CEO)는 금요일에 현행 계약이 내년 3 월에 끝나면 후속 조치가 없을 것이라고 금요일 직원에게 전했다

그러나 기술 뉴스 웹 사이트 기즈모 (Gizmodo)의 기자 인 케이트 헨거 (Kate Conger)는 BBC와의 인터뷰에서 구글이 프로젝트 메이븐 (Project Maven)을 취소하지 않았으며 향후 군사력을 배제하지 않는 것으로 보인다고 밝혔다 이 계약은 구글에 $ 10m (7,500 만 파운드) 미만의 가치가 있다고보고되었지만 잠재적으로 펜타곤과의보다 광범위한 협력으로 이어질 수있다 Project Maven은 기계 학습 및 엔지니어링 인재를 사용하여 무인 항공기 비디오에서 사람과 물체를 구분합니다 4 월까지 4,000 명의 Google 직원이 프로젝트에 참여함으로써 인터넷 거인이 사용자의 신뢰를 위험에 빠뜨리고 도덕적 및 윤리적 책임을 무시한다는 공개 서신에 서명했습니다 기즈모도 (Gizmodo)의 한 보고서에 따르면, 회사의 고위 지도부는 국방부와의 파트너십의 영향에 대해 깊은 상충 관계에있다

기자는 내부 이메일을 통해 경영진은이 계약이 커다란 기회라고 생각하면서 회사 관계가 어떻게 인식 될지 염려했다

Google Employees Demand Company Pulls Out Of Pentagon Drone Project

수십 명의 수석 엔지니어를 비롯한 수천 명의 Google 직원이 공개 서한에 서명했습니다 이 기술 대기업이 미군의 무인 항공기 프로젝트에 종사하는 것을 중단 할 것을 요구했다

펜타곤 프로그램은 인터넷 거인의 인공 지능 (AI) 시스템을 테스트하고있다 군대의 무인 감시로 확보 한 막대한 양의 영상을 분석한다 무인 항공기 타격 목표를 수립해야합니다 그러한 협력이 윤리적이지 않다고 생각하는 전문가들에게는 심각한 우려가 있습니다 "우리는 구글이 전쟁의 비즈니스에 있어서는 안된다고 믿는다

그러므로 우리는 Project Maven이 취소되고 Google이 초안을 작성하고 공개하고 명확한 정책을 시행합니다 구글도 계약자도 전쟁 기술을 만들지 않을 것이라고 말했다 편지 읽기 Press TV Reports : 3,100 명의 직원이 Google CEO 인 Sundar에게 편지를 보낸 것으로 생각됩니다 Pichai는 회사가 파일럿 실험을 중단하고 프로젝트 Maven을 요구했습니다

이 프로그램은 펜타곤이 표적에 대한 무인 항공기의보다 정밀한 공격을 돕도록 계획하고있다 시리아와 이라크를 포함한 다른 나라들에서도 마찬가지다 "우리는 구글이 전쟁의 비즈니스에 있어서는 안된다고 믿는다 그것 구글이 전쟁 기술을 결코 만들지 않을 것이라는 정책을 발표 할 것을 요구한다 이 계획은 구글의 브랜드와 재능을 겨룰 수있는 능력에 돌이킬 수없는 손상을 줄 것이다 " 편지는 말한다

"편향되고 무기화 된 AI에 대한 두려움이 커지면서 Google은 이미 대중의 신뢰를 지키기 위해 고군분투하고있다 "고 말했다 프로젝트 메이븐 (Project Maven)은 자동으로 신속하게 목표로 한 많은 미국 무인기 프로젝트 중 하나입니다 분석가가 새로운 점을 정확히 파악할 수 있도록 관심 장소를 골라 내십시오 목표 Google은 Project Maven에 대한 작업을 본질적으로 "비 공격적인"것으로 설명했지만 펜타곤의 비디오 분석은 대테러 작전에서 일상적으로 사용됩니다 하지만 그 설명은 자신의 작업이 진행되고 있다고 생각하는 Google 직원을 확신하지 못했습니다

많은 경우 민간인 사망을 초래 한 공격에 사용됩니다 실리콘 밸리는 2016 년 방위 혁신위원회 (Defence Innovation Board) 설립을 통해 미국 개척자들이 기술 개척자들이 개발 한 획기적인 기술 채택 마이크로 소프트와 아마존과 같은 Google은 수십 년 동안 다른 기술 대기업과 경쟁 할 것으로 널리 예상됩니다 수십억 달러 미국 국방부에 클라우드 서비스 제공 계약 "마이크로 소프트와 아마존 같은 다른 회사들이 참여하고 있다는 주장은 편지를 쓰면 구글을 위해 덜 위험해질 수있다 "Google의 독창적 인 역사, Do not Be Evil이라는 모토와 수십억 명의 사용자들의 삶에 직접적으로 접근 따로 설정하십시오

" 도널드 미국 대통령 이후 미국의 무인 항공기 파업 건수가 급격히 증가했다 트럼프는 12 월에 조사위원회 (Bureau of Investigative)에서 발표 한 보고서에 따르면 취임했다 저널리즘 인권 단체들의 그룹은 트럼프가 보도했다는 우려를 표명했다 새로운 무인 항공기 정책은 민간인 사상자의 위험을 증가시킵니다

국제 앰네스티, 휴먼 라이츠 워치 (Human Rights Watch), 미국 시민권 자 (American Civil) Liberties Union은보고 된 정책 변화가 의사 결정의 투명성이 결여되어 있다고 말했다 방법

Google Employees Demand Company Pulls Out Of Pentagon Drone Project

수십 명의 수석 엔지니어를 비롯한 수천 명의 Google 직원이 공개 서한에 서명했습니다 이 기술 대기업이 미군의 무인 항공기 프로젝트에 종사하는 것을 중단 할 것을 요구했다

펜타곤 프로그램은 인터넷 거인의 인공 지능 (AI) 시스템을 테스트하고있다 군대의 무인 감시로 확보 한 막대한 양의 영상을 분석한다 무인 항공기 타격 목표를 수립해야합니다 그러한 협력이 윤리적이지 않다고 생각하는 전문가들에게는 심각한 우려가 있습니다 "우리는 구글이 전쟁의 비즈니스에 있어서는 안된다고 믿는다

그러므로 우리는 Project Maven이 취소되고 Google이 초안을 작성하고 공개하고 명확한 정책을 시행합니다 구글도 계약자도 전쟁 기술을 만들지 않을 것이라고 말했다 편지 읽기 Press TV Reports : 3,100 명의 직원이 Google CEO 인 Sundar에게 편지를 보낸 것으로 생각됩니다 Pichai는 회사가 파일럿 실험을 중단하고 프로젝트 Maven을 요구했습니다

이 프로그램은 펜타곤이 표적에 대한 무인 항공기의보다 정밀한 공격을 돕도록 계획하고있다 시리아와 이라크를 포함한 다른 나라들에서도 마찬가지다 "우리는 구글이 전쟁의 비즈니스에 있어서는 안된다고 믿는다 그것 구글이 전쟁 기술을 결코 만들지 않을 것이라는 정책을 발표 할 것을 요구한다 이 계획은 구글의 브랜드와 재능을 겨룰 수있는 능력에 돌이킬 수없는 손상을 줄 것이다 " 편지는 말한다

"편향되고 무기화 된 AI에 대한 두려움이 커지면서 Google은 이미 대중의 신뢰를 지키기 위해 고군분투하고있다 "고 말했다 프로젝트 메이븐 (Project Maven)은 자동으로 신속하게 목표로 한 많은 미국 무인기 프로젝트 중 하나입니다 분석가가 새로운 점을 정확히 파악할 수 있도록 관심 장소를 골라 내십시오 목표 Google은 Project Maven에 대한 작업을 본질적으로 "비 공격적인"것으로 설명했지만 펜타곤의 비디오 분석은 대테러 작전에서 일상적으로 사용됩니다 하지만 그 설명은 자신의 작업이 진행되고 있다고 생각하는 Google 직원을 확신하지 못했습니다

많은 경우 민간인 사망을 초래 한 공격에 사용됩니다 실리콘 밸리는 2016 년 방위 혁신위원회 (Defence Innovation Board) 설립을 통해 미국 개척자들이 기술 개척자들이 개발 한 획기적인 기술 채택 마이크로 소프트와 아마존과 같은 Google은 수십 년 동안 다른 기술 대기업과 경쟁 할 것으로 널리 예상됩니다 수십억 달러 미국 국방부에 클라우드 서비스 제공 계약 "마이크로 소프트와 아마존 같은 다른 회사들이 참여하고 있다는 주장은 편지를 쓰면 구글을 위해 덜 위험해질 수있다 "Google의 독창적 인 역사, Do not Be Evil이라는 모토와 수십억 명의 사용자들의 삶에 직접적으로 접근 따로 설정하십시오

" 도널드 미국 대통령 이후 미국의 무인 항공기 파업 건수가 급격히 증가했다 트럼프는 12 월에 조사위원회 (Bureau of Investigative)에서 발표 한 보고서에 따르면 취임했다 저널리즘 인권 단체들의 그룹은 트럼프가 보도했다는 우려를 표명했다 새로운 무인 항공기 정책은 민간인 사상자의 위험을 증가시킵니다

국제 앰네스티, 휴먼 라이츠 워치 (Human Rights Watch), 미국 시민권 자 (American Civil) Liberties Union은보고 된 정책 변화가 의사 결정의 투명성이 결여되어 있다고 말했다 방법

Inside Google’s DeepMind Project: How AI Is Learning on Its Own | Max Tegmark

나는 단순히 복잡한 목표 달성에 얼마나 좋은 일 같은 지능을 정의합니다 인간의 지능 오늘날 다수의 기계 정보 오늘부터 매우 다르다 방법

첫째, 과거에 기계 지능에 그냥 항상 열등로 사용 인간의 지능 점차적으로 기계 지능은 매우 특정의 인간의 지능보다 더있어 빠른 포켓 계산기처럼 숫자를 곱 또는 큰 기억과 같은 좁은 영역, 정말 빠른 데이터의 양 우리가 지금보고있는 것은 그 기계의 지능이 그 좁은에서 약간 퍼지는이다 봉우리와 조금 더 넓은지고 우리는 여전히 인간의 지능, 인간 아이가 할 수있는만큼 광범위 아무것도 없다 거의 모든 목표 꽤 좋은 얻을 배울 수 있지만, 그 예를 들어, 지금은 시스템이 컴퓨터 게임의 다른 종류의 전체 넓은 길을 재생 배울 수 또는 드라이브하는 법을 배워야 꽤 다양한 환경에서 자동차 그리고 어

어디에서 일을 분명히 AI에 가고는 폭을 증가하고, AI의 성배됩니다 연구는 인간의 지능만큼 광범위 기계를 구축하는 것입니다, 그것은 좋은 얻을 수 있습니다 아무것도에서 그 일어난 일단 단지 인간만큼 폭 넓은 될 것 아니에요 매우 가능성 하지만 지금은 그냥 오른쪽이 아닌, 모든 작업에서 인간보다도 더 나은 나는 꽤 컴퓨터 괴상한 나 자신이야 고백해야합니다

나는 고등학교와 대학에서 다시 일부 컴퓨터 게임을 쓴, 그리고 최근 내가 봤는데 MIT에서 내 연구실 깊은 학습 연구를 많이하고 그래서 정말 좋아 저 멀리 날려 뭔가 "워"내가 처음이 구글 보았다 때 처음부터 컴퓨터 게임을 배운 DeepMind 시스템 당신은 컴퓨터 게임이 무엇인지 몰랐, 신경 네트워크 시뮬레이션이 인공 있었다, 그것은 화면, 당신은 단지 숫자에 공급 무엇인지 모르고, 컴퓨터가 무엇인지 몰랐다 그 화면에 서로 다른 색상을 표현하고 다른 출력 할 수 있음을 말했다 또한 대해 아무것도 모르는 다른 키 스트로크에 해당하는 숫자, 다음 그냥에게 점수를 먹이 유지하고, 모든 소프트웨어 아는 것은 무작위로 수행하려고하는 것이 었습니다 그 점수를 극대화 할 물건을한다 나는 화면 한 번 데미스 하사비스, 구글 DeepMind의 CEO에이를보고 기억 를 보였고,이 일을 정말 총 BS 전략을 연주하고 모든 손실 얼마나 첫번째보고 시간 후 다음 점차적으로 더 나은 얻고, 다음은 나보다 더 나은 얻고, 그것은 당신이 반송되어있는 브레이크 아웃이 미친 전략 (파악하면서 는 왼쪽 상단 모서리까지를 목표로 계속 것입니다 벽돌 벽의 떨어져 공) 거기에 구멍을 천공하고 다시 단지 주변에 튀는 공을 가지고 미친 많은 점수를 달성했다

그리고 나는 "우와, 즉 지능이다!", 같았다 그리고이 프로그램 사람은 심지어 그들이 때문에 그 전략에 대해 알고하지 않았다 매우 그 게임을하지 않았다 이 기계 지능이 작성자의 지능을 능가하는 방법에 대한 간단한 예입니다 인간의 자녀와 같은 방법으로 훨씬보다 더 지능이되고 결국 수의 부모가 교육을 잘합니다 이것은 단지 작은 작은 컴퓨터 바탕 화면에 미칠 수있는 하드웨어의 일종이다 지금 가장 큰 컴퓨터 시설까지 확장 상상하면 우리가 세계에 있고 내가 바로 그 그럴듯한 생각, 우리에게 알고리즘 개발의 더 수십 년을 제공 우리는 단지 우리보다 더 나은 컴퓨터 게임을 배울 수있는 기계를 만들 수 있지만, 게임 삶을 볼 수 있으며 우리보다 더 나은 모든 것을 할 수 있습니다

A.I Tivi | Google Using O3b Satellites to Connect Project Loon Over Puerto Rico

미국은 실험 높은 고도 풍선 프로젝트에서 사용하는 구글의 웹 위성으로부터 연결이 긴급 통신을 제공합니다 푸에르토 리코 ravish'd 허리케인 오 뼈 체포는 것을 10 월 23 말했다 위성 용량과 빠른 속도로 배포 웹을 제공하는 빠른 연결 인터넷에 푸에르토 리코를 통해 구글 유엔를 연결하기 위해 터미널있는 땅 대부분의 사람들에게 다음 빔 4G LTE 모바일 연결 푸에르토 리코의 휴대 전화 기지국이 손상되거나 허리케인 마리아에 의해 파괴되었다 이는 범주 4 폭풍 9 월 20 일 미국 연방로 ​​미국의 섬을 강타 통신위원회는에서 셀 사이트의 구십 52 %로 집계 섬은 구글이 FCC의 허가를받은 폭풍에 의해 기절했다 시간 셀의 팔십 1

9 %에서 실행 룬 시험 10 월 7 일 섬에 타워는 여전히 FCC의 가장 최근 상태 보고서를 오프라인했다 발표 10 월 22 일 셀 사이트의 예순여섯 점 6 %를 유지했다 우주 뉴스 10월 23일 SES 네트워크의 CEO 스티브와의 인터뷰에서 아래로 색상은 푸에르토 리코는 두 번째로 함께 작업 위성 사업자 말했다 구글은 페루 목표 홍수로 다음 해 3 월의 첫 번째 존재를 LOON SES 네트워크는 두 번째 링크 당 반 기가비트 사이 어딘가에 것입니다 그리고 어디서나 사용 가능한 연결의 두 번째 링크 당 기가비트 24 ~ 48 시간 이내에 세계는 그가의 알리스테어 웨스트가스를 말했다 프로젝트 아비는 AT & T와 협력 LOON 10 월 20 일 블로그 포스트에 썼다 푸에르토 리코 문자 메시지와 인터넷 액세스를 활성화하기 우리는 그런에서 처음부터 프로젝트 아비 연결을 배치 적이 빠른 속도로 우리는 AT & T의 지원과 다른 많은에 감사있어 이 가능하게 한 파트너 및 단체 그는 칼라 웹 링크가 SES보다 약간 이상했다 설정하는 것을 썼다 네트워크 때문에 재난 대응의 CLEC 도시의 목표를 언급하고 SES 네트워크와 함께 구글의 아비와 페어링 위성의 고유성 지역의 통신 사업자 자유 케이블 비전은 땅을 수립하는데 도움을 아비 Westgarth 인프라는 비상 대응 관리가 계속 썼다 직접 푸에르토 리코와 멕시코 만에 위성 통신을 사용 지원 구호 활동 함대 운영자 인텔샛 10 월 23 일 그것이 말했다 장착 된 차량에 세 유미 즙을 통해 위성 연결을 기부 다음 8 주 동안 자유 세계 푸에르토 리코 FCC는 위성 연결 트럭에 통신 서비스를 제공하고 있습니다 말한다 아레 시보 라디오의 아레 시보 홈을 포함하여 섬 11 개 카운티 망원경