How to Make a Data Science Project with Kaggle

YUFENG GUO : "Cloud"에피소드 인공 지능 모험, "나는 메간 Risdal을 초대했습니다 쇼에서 나와 함께하기 함께, 우리는 Kaggle에서 우리 자신의 데이트 과학 프로젝트를 요리 할 것입니다

오늘 어떠니, 메간? 메간 리달 : 잘하고 있어요 너의 쇼에 나를 갖게 해줘서 고마워 YUFENG GUO : 굉장합니다 그리고 우리가 가기 전에, 나는 당신이 무엇에 대해서 이야기 할 기회를 갖게 해줄 수 있어요 당신은 Kaggle과 당신의 역할을합니다

메간 리 다르 : 물론 그래서 나는 Kaggle의 데이터 세트의 제품 책임자입니다 이것이 의미하는 것은 제가 엔지니어들과 함께 일한다는 것입니다 우리의 디자이너뿐만 아니라 우리의 커뮤니티 데이터 과학자들이 발견 할 수있는 도구를 만들기 위해, 공유 및 분석 할 수 있습니다 그리고 오늘, 우리가 원하는 것은 Kaggle을위한 것입니다

170 만 데이터에 가장 적합한 장소 과학자들이 데이터 과학을 공유하고 협력한다 프로젝트 YUFENG GUO : 굉장합니다 그리고 오늘, 우리는 함께 일할 것입니다 가장 신선한 재료를 사용하는 것 – 메간 리 다르 : 데이터

YUFENG GUO : 다른 도구를 사용하여 준비하십시오 우리의 맛있는 결과를 만들기 위해 함께 일합니다 이 공용 데이터 세트 및 노트 시원한 분석을 가진 세계와 공유 할 수있다 그것과 함께 갈 것입니다 그래, 그래

맞습니다 오늘 정말 기쁩니다 왜냐하면 우리는 정말로 이것은 공동 프로젝트입니다 그래서 그것이 우리가 일을 끝내는 방법입니다 팀워크

YUFENG GUO : 팀웍 괜찮아 가자 그래서 메간은 이전 에피소드에서 "AI Adventures" 얻는 방법을 보여주는 동영상을 보았습니다 Kaggle 커널로 시작되었습니다

그리고 시작하기 만하면 매우 초보적이었습니다 그것은 굉장합니다, 그것은 자유로운 자원입니다 하지만 그 이후로 몇 가지 새로운 기능이 출시되었습니다 그것은 정말로 Kaggle의 기능을 향상시킵니다 사용되는 커널과 데이터 세트 모두 개인 및 팀을위한 훌륭한 도구입니다

MEGAN RISDAL : 네, 맞습니다 그래서 오늘, Kaggle는 정말로 멋진 장소입니다 R 및 Python을 사용하여 데이터 작업을하는 사람들에게 유용합니다 그들은 정말로 데이터 과학 포트폴리오를 구축하고 있으며, 데이터 분석 작업을 수행하거나 연구를 공유 할 수도 있습니다 데이터 과학을 수행하는 데는 많은 도구가 필요합니다

그리고 Kaggle은 실제로이 원 스톱 상점으로 활동합니다 이러한 모든 도구를 제공하는 데이터로 작업하는 것을 가능하게합니다 개인적으로, 그것을 세계와 공유하는 것 YUFENG GUO : 그리고 그것은 정말로 – 정말 환상적입니다 사실에 대해 좀 더 살펴 보겠습니다

Kaggle 데이터 집합과 커널이 지원할 수 있음 이런 종류의 공동 모델,이 개인 모드, 당신이 원한다면 MEGAN RISDAL : 최근의 몇 가지 기능 개인 데이터 세트를 게시하고 작업 할 수있는 능력 및 커널 커널에 관해서는 기본적으로 클라우드의 랩톱처럼 노트북보다 강력합니다 내가 오늘 여기에서 일하고있다

RAM 16 개, CPU 4 개, 계산 시간 6 시간입니다 그리고 정말 흥미 진진한 것들 중 하나 그것은 도커 컨테이너에 모두 있다는 것입니다 데이터 과학자들이 좋아하는 모든 패키지가 들어 있습니다 사전 설치 따라서이 환경을 한 번 클릭하면됩니다

그리고 마지막으로 더 많은 사용자 정의를 추가하기 시작합니다 그래서 누락 된 패키지가 있다면, GPU를 설치하거나 GPU를 추가 할 수 있습니다 YUFENG GUO : 오우 그래, 그래 YUFENG GUO : 매우 좋습니다

오늘 특정 데이터 세트를 선택했습니다 로스 앤젤레스시의 데이터 주변에서 놀아 라 내가 제대로 이해한다면 MEGAN RISDAL : 네, 맞습니다 그래서 많은 정부와 기관들이 전 세계와 미국에서 열린 데이터를 부분적으로 이용 가능하게 만들고있다

그들의 오픈 데이터 이니셔티브를 그들의 작품은 더욱 투명합니다 그래서 나는 로스 앤젤레스 출신이다 나는 로스 앤젤레스에 살고있다 그리고 나는보기에 관심이 많았습니다 로스 앤젤레스 시가 공개 한 데이터 중 일부는 사용할 수 있습니다

그래서 나는 오픈 데이터 포털을 둘러 보았습니다 이 사람이 내 눈에 들어왔다 왜냐하면 나는 약간의 foodie 좀 재미 있어요 하지만 실제로 환경 보건법 위반입니다

로스 앤젤레스의 레스토랑과 시장에서 YUFENG GUO : 좋습니다 좋아, 들어 가자 네 MEGAN RISDAL : 그래, 내가 한 일 데이터 세트를 다운로드 했습니까? 이제 로컬 컴퓨터에 있습니다

YUFENG GUO : 좋습니다 메간 리 다르 : 그리고 우리가 할 일은 그것을 Kaggle에게 업로드하고 있습니다 이것은 우리 프로젝트의 기초가 될 것입니다 YUFENG GUO : 굉장합니다 그리고 제가 종종 듣는 것들 중 하나는 – 어떤 사람들은 분산되어있는 것에 관심이있다

컴퓨팅 및 방대한 데이터 세트 방금 언급했듯이이 데이터 세트를 다운로드합니다 귀하의 로컬 컴퓨터에 그리고 몇몇 사람들은, 오, 나는 많은 계산과 자원이 필요하다고 말합니다 Kaggle은 유스 케이스를 지원할만큼 강력 할 것인가? 그리고 나는 Kaggle을보고, 당신이 언급 한 활기찬 지역 사회 – 170 만 명이 었나요? 그래, 그래

그게 오늘 우리가있는 곳입니다 YUFENG GUO : 놀랍습니다 사용 사례가 너무 많음을 분명히 보여줍니다 그 밖의 거대한 대규모 데이터 세트를 넘어서 당신이 도망 갈 수있는 상황이 있습니다

아주 먼 곳으로 데려다 줄 수있는 강력한 기계가 하나 있습니다 MEGAN RISDAL : 네, 맞습니다 그래, 우리는 사람들이 수천을 업로드하고있다 한 달에 걸친 데이터 세트 수 YUFENG GUO : 예, 와우 좋아 이제 네 랩탑으로 가자 우리가 그 일을 어떻게 진행하는지보십시오

Kaggle에서 어떻게 새로운 데이터 세트를 만들 수 있습니까? 메간 리 다르 : 물론 그래서 우리는 Kaggle 's의 데이터 세트 페이지에서 시작하려고합니다 웹 사이트 그래서 이것이 어떻게 생겼는지입니다 그리고 기본적으로 이것은 여러분이 가지고있는 곳입니다

공개적으로 공개 된 모든 데이터 세트에 대한 액세스 Kaggle에 게시 됨 그리고 우리는 오늘 우리 자신의 것을 추가 할 것입니다 그래서 저는 새로운 데이터 세트를 클릭 할 것입니다 그리고 여기에서, 그것은 단지 문제입니다 파일 끌어서 놓기 내가 업로드하도록 선택한 그리고 이것들은 Los의 레스토랑과 시장에 대한 검사입니다

앤젤레스와 위반 그리고 나서 약간의 메타 데이터를 추가해야합니다 데이터 세트가 시작되도록합니다 그래서 저는 여기서 필요한 모든 정보를 얻을 것입니다 그래서 우리는 비공개로 유지할 것입니다

왜냐하면 우리가 이야기 한 것처럼 잘 문서화되도록 데이터 세트를 준비하고 싶습니다 그리고 나서 우리도 놀 것입니다 데이터를 조금씩 사용하여 커널을 작성하십시오 공개적으로 공유하기 전에 YUFENG GUO : 네, 대단합니다 그리고 그것은 분명히 얻지 못하는 것입니다

데이터 집합에 대한 문서가 많이 나와 있습니다 MEGAN RISDAL : 네, 맞습니다 YUFENG GUO : 코드의 문서 매우 잘 이해되고 있으며, 사람들은 그 집을 망치고 있습니다 그러나 데이터 세트에 대한 문서는 새로운 개념입니다 MEGAN RISDAL : 맞아

예, 실제로 데이터에 액세스 할 수있게하는 것입니다 데이터 파일 자체를 기계로 읽을 수있게 만드는 것만이 아닙니다 CSV 포맷이 잘되어 있습니다 또한 일하는 데 관심이있는 사람을 도왔습니다 이 데이터는 실제로 그것을 이해합니다

이제 Create Dataset을 클릭하기 만하면됩니다 YUFENG GUO : 환상적입니다 괜찮아 그리고 귀하의 개인 데이터 세트가 성공적으로 생성되었습니다 메간 리달 : 예

YUFENG GUO : 우우 MEGAN RISDAL : 멋지다 이제 개인 데이터 집합이 업로드되었습니다 그리고 그것이 여기에 우리에게 알려주 듯이, 이제 우리는 이미 데이터 세트를 분석하기 시작한 것에서부터 무엇이든 할 수 있습니다 공동 작업자 추가에 이르기까지 그 두 가지를 할 것입니다

YUFENG GUO : 환상적입니다 MEGAN RISDAL : 확인을 클릭합니다 그리고 그것은 우리를 우리의 데이터 세트로 데려 갈 것입니다 YUFENG GUO : 좋아 보인다 그래, 그래

YUFENG GUO : 그건 진짜 같은 것입니다 MEGAN RISDAL : 네, 맞습니다 그래서 우리가 사람들이 창조 할 때하고 싶은 일 개인 데이터 집합을 사용하면 자신이 쉽게 만들 수 있습니다 그런 다음 해당 데이터 세트를 공개하고 공유하십시오 커뮤니티와 그래서 우리는이 품질 체크리스트를 제공합니다

사람들이 기본적으로 데이터 세트를 문서화하는 데 도움이됩니다 그들이 그것을 나눌 때 성공하도록 돕습니다 그래서 우리는 빨리 갈 것입니다 이 품질 체크리스트를 통해 그래서 첫 번째는 설명을 제공합니다 그리고 이것은 단지 마크 다운 파일이므로 여기에 저장했습니다

YUFENG GUO : 좋습니다 네 그게 정말 멋지다는거야 어떤 종류의 것들에 대한 지침 데이터 세트를 멋지게 만들기 위해 추가 할 수 있습니다 MEGAN RISDAL : 네, 맞습니다

YUFENG GUO : 좋은 경험을하십시오 그래, 그래 그래서 저는 이해와 같은 것들을 생각합니다 데이터의 맥락과 흥미로운 이유 왜 그것을 공유하는지가 중요합니다 더 자세한 정보를 제공 할뿐 아니라 해당 데이터 세트의 내용에 대해 그래서 그것이 우리가 여기에서 한 것입니다

그리고 영감도 – 그래서 몇 가지 질문을하면 데이터를 사용하여 대답 할 수 있습니다 YUFENG GUO : 네 거기서 다른 데이터 세트를 보았습니다 이제 나는 왜 [부적절한], 거기에 어떤 지침이 있음을 안다 MEGAN RISDAL : 맞습니다

네 그럼이 페이지의 다음 일은 우리는 몇 개의 태그를 추가 할 것입니다 일단 데이터 세트가 검색되면 데이터 세트를 더 쉽게 찾을 수 있습니다 공개적으로 공유 할 준비가되었습니다 그래서 우리는 공중 보건과 음식과 음료를 할 것입니다

YUFENG GUO : 합리적인 것 같습니다 MEGAN RISDAL : 합리적인 것 같습니다 그러면 자막과 배너 이미지를 추가 할 것입니다 그리고 이것은 페인트의 마지막 외투를 추가하는 것입니다 잘 보이게하고 사람들이 이해하도록 돕기 위해 데이터 세트에 관한 것입니다

YUFENG GUO : 예 – 약간의 재능 MEGAN RISDAL : 네, 맞습니다 YUFENG GUO : 좋습니다 MEGAN RISDAL : 그럼 우리가 그걸 살릴거야 YUFENG GUO : 그리고 우리는 그들이이 이미지를 대체하기를 원합니까? 그래, 그래

이것이 데이터 집합 목록에서 Google이 볼 수있는 것입니다 그리고 당신은 그 표지에 의해 데이터 세트를 판단하지 않아도됩니다 그러나 그것이 화려한 이미지를 가지고 있다면 – 오직 도움이 될 수 있습니다 YUFENG GUO : 예 나는 항상 얇게 썬 양파의 이미지가있는 데이터 세트를 선택합니다

그렇지 않은 사람 MEGAN RISDAL : 맞습니다 맛있어 보인다 그리고 마지막으로, 가장 중요한 부분 나는 당신을이 데이터 세트의 공동 작업자로 추가 할 예정입니다 YUFENG GUO : 그래서 지금 나는 그것을 보게된다? 그래, 그래

YUFENG GUO : 좋습니다 그래서 결국 – MEGAN RISDAL : 당신이 계십니다 편집 권한을 부여합니다 YUFENG GUO : 감사합니다 Megan Risdal이 데이터 집합을 편집하도록 초대했습니다

큰 그리고 Kaggle에서보기를 클릭 할 수 있습니까? 그래, 그래 YUFENG GUO : 그리고 그 모습을 보자 굉장해 그래서 이것은 당신 편에서 본 것과 기본적으로 같습니다

MEGAN RISDAL : 네, 맞습니다 시원한 그래서 우리는 우리의 데이터를 업로드하고 문서화했으며, 너와 그걸 나눠 봤어 우리가 사람들에게하도록 권하는 것들 중 하나 코드를 통해 데이터 세트를 문서화하는 것입니다 그래서 내가 말하는 것은 출판입니다

데이터 세트의 커널은 사용자에게 시연 할 수있는 한 가지 방법이며, 지역 사회의 다른 사람들, 그들은 당신의 데이터로 할 수 있습니다 그래서 우리는 누군가를 커널에 보여주고 싶을 것입니다 데이터를 읽는 방법, 일부 데이터를 읽을 수있는 방법 데이터를 사용하여 시각화 할 수있는 질문, 질문 그것을 사용하여 답변을 얻을 수 있습니다 YUFENG GUO : 네 요즘 Kaggle에서 데이터 세트를 볼 때, 그들 모두는이 탐험 수첩을 가지고있다

환상적인 시각화를 사용하면 정말 좋습니다 그래, 그래 예 바로 그 거예요 새로운 데이터 세트 작업을 시작할 때, 보통, 당신이 지역에서 일할 때, 커서가 깜박이기 시작합니다 당신에게 보여주는 코드가 없습니다

데이터를 읽는 방법과 데이터로 작업하는 방법 그래서 우리가하려고하는 것은, 데이터 세트를 추가로 문서화 할 것입니다 커널을 게시하여 YUFENG GUO : 환상적입니다 메간 리 다르 : 시작합시다 이 빅 블루 버튼을 클릭하기 만하면됩니다

우리가 부르는대로 – 새로운 커널 YUFENG GUO : 예 MEGAN RISDAL : 여기서는 스크립트 사이에서 선택할 수 있습니다 및 노트북 내가 좋아하기 때문에 나는 노트북과 함께 갈거야

인터리빙 마크 다운 및 코드 그리고 나서 이것이 시작되는 동안, 나는 할 수있다 내가 접근 할 수있는 데이터를 가지고 있는지 보아라 여기 내 환경에서 내 손가락 끝에 YUFENG GUO : 좋습니다

MEGAN RISDAL : 저는 언어를 바꿀 것입니다 R 저는 Stats 사람입니다 맞습니다 YUFENG GUO : 좋습니다

MEGAN RISDAL : 멋지다 내가 한 일은 내가 바람을 피웠다는 것입니다 이미 코드를 준비했습니다 내가 사용할거야 그래서 저는 여기서 그것을 빨리 업로드 할 것입니다

그리고 나서 내가 너를 걸을거야 데이터 세트를 분석하기 위해 수행되었습니다 YUFENG GUO : 좋습니다 메간 리 다르 : 그래서 첫 번째 셀에서, 검사 CSV 파일과 위반 CSV 파일이 있습니다 그래서 나는 그 사람들을 읽고 그것에 참여할 것입니다

함께 일련 번호를 기입 한 다음 결과 데이터 프레임을 엿볼 수 있습니다 YUFENG GUO : 좋습니다 메간 리 다르 : 그렇게되면, 우리는 거의 900,000 개의 레코드를 가지고 있음을 알 수 있습니다 우리가보고있는 것 그래서 이들은 모두 건강법 위반입니다

약 2 년간의 데이터 YUFENG GUO : 좋습니다 2 년 동안은 그렇게 많이 남아 있습니다 MEGAN RISDAL : 그래, 그게 그 것처럼 보인다 그래서 우리는 그 모습을 파헤칩니다 이제 데이터 세트를 준비 했으니 까 내가 원하는 모양으로, 위반의 수를 봅니다 월별로보고 됨

YUFENG GUO : 맞습니다 이것은 큰 것입니다 그래, 맞아 괜찮아 YUFENG GUO : 좋습니다

MEGAN RISDAL : 그래서 당신은 그것이 얼마나 빠르고 빠르는지 알 수 있습니다 그리고 우리는이 시각화를 가지고 있습니다 우리 앞에서 그래서 그것은 많은 건강법 위반입니다 YUFENG GUO : 네

그것은 온통 여기에 있습니다 어떻게 생겼는지 바는 무엇입니까? 30,000? MEGAN RISDAL : 네, 맞습니다

YUFENG GUO : 한 달 안에? 메간 리 다르 : 네 네 YUFENG GUO : 그것은 두더지입니다 메간 리달 : 네 자, 계절 추세가 있는지 살펴 봅시다

또한 위반 사항에 대한 정보도 있습니다 일련 번호마다 그래서 우리는 그것을 살펴볼 것입니다 그리고 우리는 상위 10 개를 살펴볼 것입니다 위반 사항이 있으므로이 코드가 여기에서 수행 될 것입니다

YUFENG GUO : 우리는 그것을 실행하고 우리는 다음과 같이 갈 것입니다 – 와우, 아주 좋은 색상의 코딩이 여기 있습니다 저 더 어두운 사람이 더 많거나 더 가벼운 사람은 더? 메간 리 다르 : 라이터가 더 밝습니다 YUFENG GUO : 좋습니다 그래, 그래 네, 여기 이걸 볼 수 있어요

바닥, 벽, 천장은 제대로 건축되고, 유지되고, 잘 수리되고, 깨끗하게 YUFENG GUO : 좋습니다 그래, 그래 YUFENG GUO : 항상 유감스럽게 생각합니다 귀하의 시설이 잘 수리되고 있는지 확인하십시오

MEGAN RISDAL : 네, 맞습니다 그리고 마침내, 나는 단지 저장하려고합니다 나중에 염두에 두어야 할 또 다른 프로젝트는 우편 번호로 위반 사항을보고 싶습니다 그래서 우리는 각 시설에 대한 정보도 얻었습니다 그들의 주소는이다

그래서 우리는 그곳에 우편 번호와 표정에 의한 위반이 더 많다 지형 공간 분석에서 하지만 나중에 조금하고 싶습니다 CSV를 파일로 작성하려고합니다 그리고 나는 그것을 다른 커널에서 사용할 수있을 것이다

YUFENG GUO : 맞습니다 그리고 당신은 상상할 수 있습니다 나는이 새로운 산출물에 대해서 생각하려고 노력하고있다 당신이 만든 것, 당신은 어떤 종류의 매핑을 만들 수 있습니다 그것으로

멋진 색으로 구분 된 히트 맵 중 하나를 수행 할 수 있습니다 MEGAN RISDAL : 네, 그렇습니다 YUFENG GUO : 우리는 이런 종류의 히트 맵을 가지고 있습니다 유형별로 위반 사항을 보여 주지만, MEGAN RISDAL : 그래, choropleth지도 지형 공간처럼 – YUFENG GUO : 혀 트위스터가 있습니다 메간 리 다르 : 예, 전성기

네, 정확히 말하면, 지금, 어떻게이 데이터 세트를 엿볼 수 있을까요? 이미 새로운 질문에 영감을 불어 넣었습니다 이것이 바로 사용자를 위해 우리가하고 싶은 일입니다 그래서 나는 내 노트에 제목을 부여 할 것입니다 YUFENG GUO : 예, 항상 제목이있는 것이 좋습니다 그래, 그래

그런 다음 커밋하고 실행합니다 YUFENG GUO : 좋습니다 그러니 그걸 치자 그게 실행되는 동안, 당신을위한 질문 – 너라면 노트북을 구할 수 없어? 커밋 및 실행을 클릭하지 않았습니까? 클릭하기 전에 해당 탭을 닫으려면, 그 모든 코드에 무슨 일이 일어날 것인가? MEGAN RISDAL : 초안을 저장하고 있습니다 하지만 코드를 저장하려면 나중에 다시 돌아와 다른 사람들과 공유하십시오

당신은 Commit and Run을 치고 싶다 그리고 그것은 코드를 위에서 실행합니다 바닥에 YUFENG GUO : 맞습니다 완전한

한 번 끝나면 다음 단계는 무엇입니까? 우리 계획은 여기서 뭐지? 왜냐하면 지금 당장 우리는 비공개이지만 우리 사이에 공유되는 데이터 세트가 있어야합니다 우리는 여전히이 커널을 가지고 있다고 생각합니다 너에게 개인적으로, 맞지? MEGAN RISDAL : 그래, 일단 이것이 끝나면, 계속해서 스냅 샷보기를 클릭하겠습니다 그리고 이것은 우리를 노트북 뷰어로 데려 갈 것입니다 그리고 여기에서, 이것은 내가 세상과 나눌 것입니다

그리고 이것은 누군가가 데이터 세트를 보는 것입니다 찾을 수 있습니다 그래서 나는 앞으로 나아갈 것이고, 다시 당신과 이것을 나눌 것입니다 당신이 우리의 모든 일이 공개 될 준비가되었습니다 YUFENG GUO : 맞습니다

예, 팀 환경에서, 당신은 근본적으로 일종의 코드 리뷰를하기 위해 이것을 할 수있다 대본 그래, 맞아 YUFENG GUO : 좋습니다 그러니 일단 끝내면 내 노트북에서 이쪽으로 갈 수 있습니다

데이터 세트에서 커널을 클릭하고 이동합니다 당신의 일에, 나는이 경우에 당신의 일이라고 생각합니다 MEGAN RISDAL : 맞아 YUFENG GUO : 여기 노트북을 열어 드리겠습니다 그리고 여러분은 그것이 잘로드되어 있음을 볼 수 있습니다

그리고 노트북을 편집하거나 포크 할 수있는 옵션이 있습니다 그래, 그래 그럼 어째서 그 일을 포기 하렴 모든 것이 예상대로 실행되는지 확인하십시오 그리고 모든 것을 컴파일 할 수 있습니다

YUFENG GUO : 내가 그것을 포크로 할 때, 그런 다음 GitHub에서 저장소를 포크 할 때와 비슷합니다 MEGAN RISDAL : 맞아 YUFENG GUO : – 당신은 당신 자신의 복사본을 만들 수 있습니까? 자, 이건 내거야? 그래, 그래 이것은 코드뿐만 아니라 코드의 사본이기도합니다 내가 사용한 데이터와 내가 사용한 환경

YUFENG GUO : OK, 잡았다 그리고 지금은 아무 것도 당신 편에 변화를줍니다 내 사본에 영향을 미치지 않습니다 MEGAN RISDAL : 맞습니다 YUFENG GUO : 좋습니다

자, 이제 실행하고있어 다른 커널을 생성한다 이름을 변경해야합니까? 내가 그대로두면 거기에 이름 충돌이있을거야? 메간 리 다르 : 당신은 그것을 바꿀 필요가 없습니다 그래서 사용되는 민달팽이는 사용자 이름이고, 노트북 제목의 슬러그 YUFENG GUO : 잡았다

그래서 나는 그것을 바꿀 수 있었지만 그렇게 할 필요는 없다 MEGAN RISDAL : 맞아 YUFENG GUO : 자, 제가 다시 가면 오, 우리는 그것이 그것을하는 것을 볼 수 있습니다 내 포크를 다른 사람들과 공유하십시오 MEGAN RISDAL : 네, 맞습니다 YUFENG GUO : 우리는 우리의 데이터를 볼 수 있습니다 제가 지금 다시 클릭하면, 이것은 – 일단 끝나면 그냥 나타납니다? 메간 리 다르 : 그렇습니다

YUFENG GUO : 그리고 거기에 있습니다 괜찮아 메간 리달 : 굉장해 그래서 당신은 어떻게 생각하십니까? YUFENG GUO : 꽤 좋은, 꽤 좋다 나는이 사실을 현실로 공개 할 때라고 생각한다

메간 리달 : 예, 공개하겠습니다 YUFENG GUO : 좋습니다 MEGAN RISDAL : 멋지다 그래서 데이터 세트로 돌아가겠습니다 그리고 Settings (설정), Sharing (공유)으로 이동하여 준비가되었다고 생각하면, 공개로 만들기를 클릭 할 수 있습니다

YUFENG GUO : 좋아,하자 따라서 이것은 영구 공개됩니다 MEGAN RISDAL : 맞습니다 YUFENG GUO : 좋습니다 그것은 당신이 여기에 들어가는 것을 아는 것이 항상 좋은 것입니다

좋은 메간 리 다르 : 그리고 여기에 우리가 간다 그리고 나서 다음 단계는 물론입니다 커널을 공개하길 원한다 YUFENG GUO : 오, 맞아

커널 자체가 데이터 세트와 분리되어 있기 때문에, 그래서이 두 개념은 구별됩니다 MEGAN RISDAL : 맞습니다 YUFENG GUO : 그래서 이런 상황에서, 네가 물건을 썼던 곳 일 수도 있고, 그리고 당신은 당신의 것을 공개합니다 그런데 나는 그것을 포크로 찍는다 그리고 그것은 사적이다

그리고 나는 너 또는 다른 사람들과 개인적으로 그것을 확장 할 수있다 그리고 아마도 다른 버전을 출시 할 것입니다 몇 가지 다른 분석과 함께 MEGAN RISDAL : 맞아 예 바로 그 거예요

따라서 유연성은 귀하에게 달려 있습니다 YUFENG GUO : 굉장합니다 MEGAN RISDAL : 데이터 측면이 공개됩니다 그리고 데이터 과학자 커뮤니티의 모든 사람 음식점 검사에 대해 더 많은 것을 탐색 할 수 있습니다 로스 앤젤레스 카운티의 위반

YUFENG GUO : 맞습니다 맞습니다 현재 축소 된 내용을 살펴보면, 그것은 아주 조금입니다 그리고 도구는 모두이 패키지에 들어 있습니다 정말 멋지고 완벽한 플랫폼입니다

나는 정말 즐거웠다 그리고 우리는 당신 편에서 노트북과 데이터 세트를 만들었습니다 우리는 개인적으로 공개적으로 공유 할 수있었습니다 그리고 우린 물건에 빠지지도 않았어 댓글 달기 시스템 및 토론 포럼과 같은 그리고 Kaggle에게는 훨씬 더 많은 것이 있습니다

그러나 공동 작업과 공유 환경조차도 너무 부자 야 그래, 그래 그래서 처음부터 끝까지 프로젝트를 만들었습니다 로컬 컴퓨터에서 데이터 파일을 가져 왔습니다 이 재현 가능하고 문서화 된 데이터 세트에 세상과 공개적으로 공유됩니다

그리고 어떻게하면 누군가가 학교 프로젝트에 이것을 할 수있다 또는 연구 공유 방법 YUFENG GUO : 당연히 네 그래서이 노트는 정말로 공개됩니다

그래서이 비디오를보고 있다면, 당신은 지금 Kaggle에 가서이 데이터 세트에 접근 할 수 있습니다 설명에 노트북에 대한 링크가 포함됩니다 동영상 아래에서 공유하고 공유하면됩니다 노트북, 데이터 세트를보고 댓글을 달 수 있으며, 자신의 노트를 포크로 만들고 편집하십시오 오늘 Megan과 함께 해줘서 고마워

이 Kaggle 커널을 조합하는 것은 정말 재미있었습니다 우리는이 데이터 세트를 만들어 전세계에 공개합니다 이 비디오가 마음에 들면 좋아요 버튼을 누르십시오 아래에서 아래로 클릭하고 구독하기를 클릭하십시오 "Cloud AI Adventures"의 모든 에피소드 그들이 나오면 바로

당분간, 나와 메간은 돌아갈거야 이 커널 작업 그러나 이번에는 아마 설득 할 수 있습니다 그녀는 파이썬에서 그것을 할 수 있습니다 메간 리 다르 : 우리는 그것에 대해 알게 될 것입니다

YUFENG GUO : 좋습니다