500대 기업 (500명의 CEO) 소셜미디어 데이터 수집
Forbes 500 기업들의 10년 동안의 CEO들, 그들의 10년동안의 4종류의 Social Media (Facebook, Twitter, Instagram, LinkedIn) text 내용을 데이터로 수집하고자 합니다.
API를 통해 데이터 수집을 해본 경험이 있으신 분이면 일 하시는데 편하실 겁니다.
상세 설명:
Forbes 500 기업의 CEO들 중 4종의 Social Media (Facebook, Twitter, Instagram, LinkedIn)을 사용하는 CEO들이 10년간 (2011-2020) 올린 post 와 comments, likes, retweets, following 와 follower, 계정 자기 소개 등의 모든 활동 데이터를 timestamp와 함께 수집하고자 합니다.
데이터 수집 계획은
1) Forbes 500 통해 2011-2020년 동안 Forbes 500 기업들의 연도별 CEO 명단 및 기업 재무정보
2) 위의 10년간의 CEO명단 속의 CEO들의 4종의 Social Media 공인 계정 (공인 계정일 시 해당 CEO의 계정으로 인정합니다).
3) 4종의 Social Media API를 통한 10년간 CEO들의 소셜미디어 내에서의 각 데이터의 timestamp와 같이 활동 데이터 및 활동 내용 (post,comment,retweet, reply 등의 텍스트 내용) 를 수집해주시면 됩니다 (데이터가 향후 panel data로 구축될수 있어야 합니다) . 최종 저희한테 제출해주실 결과물은 .csv 파일 혹은 .sql파일들 입니다.
고려사항:
4개의 종의 Social Media API에서 이전에 삭제된 글도 데이터 수집이 가능한지 우선 판단해주세요. 만약, 이전에 삭제된 글은 API에서 어떠한 기록도 없고 수집이 되지 않는다면 다른 방식의 데이터 수집을 협의해야 할거 같습니다.
모든 사항 협의 가능합니다.