본문 바로가기

전체 글

(51)
비행기 연착 관련 글을 읽고 마부뉴스에서 제공하는 '구독자, 비행기 연착 때문에 곤란해진 적 있어?' (링크)를 읽고 짧은 생각을 정리했다. 먼저, 아티클을 요약하면 아래와 같다.  항공기 지연 데이터 분석2019년: 국제선 승객 9,038만 명, 국내선 포함 1억 2,337만 명.코로나19: 2021년 국제선 승객 320만 명.2023년: 국제선 승객 6,831만 명, 국내선 포함 1억 명 회복.2024년 상반기: 국제선 승객 4,847만 명.지연 건수 증가 원인2023년 국제 기준 적용: 지연 기준이 15분으로 변경됨.노후화된 항공기와 인력 문제: 신규 여객기 도입 지연과 정비 인력 부족.2024년 상반기: 2만 3,552번 지연 발생.주요 지연 사유연결: 앞선 스케줄의 지연이 연쇄적으로 영향을 미침.정비 이슈: 노후화된 항공기..
R 공부 (4편) - 쉽게 배우는 R 데이터 분석 데이터 정제결측치란 누락된 값을 의미한다. df  is.na() 함수를 사용하면 결측치를 확인할 수 있다. 'TRUE' 라고 표시되면 결측치이고, 'FALSE' 라고 표시되면 결측치가 아니다. 또한, table() 함수를 사용해서 결측치가 총 몇개 있는지 확인할 수 있으며, 변수명을 지정하면 해당 변수의 결측치의 빈도를 확인할 수 있다.   df_nomiss % filter(!is.na(score) & !is.na(sex)) # sex, score 결측치 제거df_nomiss# 출력값 sex score1 M 52 F 44 M 4df_nomiss2 34 M 45 F 3  is.na() 함수를 사용하면 결측치 없는 데이터를 추출할 수 있다..
R 공부 (3편) - 쉽게 배우는 R 데이터 분석 데이터 전처리dyplr은 데이터 전처리 작업에 가장 많이 사용되는 패키지이다. exam %>% filter(class == 1) # class가 1인 경우만 출력# 출력값 id class math english science1 1 1 50 98 502 2 1 60 97 603 3 1 45 86 784 4 1 30 98 58 여기서 %>%는 파이프 연산자로 왼쪽의 결과를 오른쪽 함수로 전달하라는 뜻을 가지고 있다. filter()에 조건은 '같다'라는 의미를 가지는 '=='도 가능하지만 '같지 않다'라는 '!='도 가능하며 부등호도 쓸 수 있다.  AND, OR 같은 조건도 filt..
R 공부 (2편) - 쉽게 배우는 R 데이터 분석 데이터 프레임 중데이터 프레임은 행과 열로 구성된 표를 의미한다. 데이터 프레임을 R로 아래와 같이 구현할 수 있다. # data.frame()을 이용해서 데이터 프레임 만들기df_midterm   데이터 프레임을 만들기 위해 data.frame() 함수를 사용했다. 들어가는 매개변수에는 변수를 만들되, 쉼표로 구분하면 된다. 그러면 아래와 같은 출력을 확인할 수 있다.  english math1 50 102 60 403 70 504 80 605 90 70  또한, 앞서 배운 mean() 함수를 사용해서 평균을 구할 수 있다. midterm_average_english midterm_average_english[1] 70> midterm_..
R 공부 (1편) - 쉽게 배우는 R 데이터 분석 R에 대한 나의 생각 (feat. Python과의 차이)최근에 R을 새로 배우는 중이다. 원래 나의 주언어는 Python이지만 두 언어의 각각의 강점과 특성을 잘 파악한다면 더 큰 시너지 효과를 얻을 수 있을 것 같아 공부를 시작했다. 간단하게 두 언어의 차이를 말하자면, R은 통계 분석과 시각화를 위해 개발된 프로그래밍 언어이자, 통계 모델링과 데이터 분석에 특화되어 있다. 하지만, Python 같은 경우는 범용 프로그래밍 언어로 데이터 과학뿐만 아니라 웹 개발, 자동화, 인공지능 등 다양한 분야에서 활용된다. 따라서, 어떤 언어를 배워 어떻게 활용하는 가에 따라 본인이 공부하고자 하는 언어가 달라질 것 같다. 현재 나는 데이터 분석에 대한 깊은 이해를 얻고 싶고 R로부터 얻은 지식을 Python에서도..
Ali Express 상품 리뷰를 통한 감정 모델 분석 문제 정의 💥야구나 홈쇼핑 같은 라이브 방송 중에 실시간으로 송출되는 댓글들이 있다. 주로 시청자 참여를 촉진하고, 실시간 상호작용을 통해 방송의 생동감을 높이기 위함이다. 하지만, 안타깝게도 '그 의도'와 벗어난 댓글들이 올라올 때가 있다. 부정적인 반응이나 교묘하게 돌려까는(?)식의 댓글들이 화면에 노출되기도 한다.  즉, 그러한 문제를 방지하고, 라이브 방송의 품질을 유지하기 위해 선제적으로 부적절한 댓글을 필터링하는 시스템이 필요하다. 따라서, 이번에는 BERT 모델을 활용하여 실시간 댓글의 감정을 분석하고, 부정적인 댓글을 사전에 예측하여 필터링하는 것을 목표로 모델을 구현했다.   근데 왜 BERT?BERT는 양방향성을 가지는 언어 모델로, 문맥을 깊이 이해할 수 있기 때문이다. 일반적인 R..
날씨 마케팅, 현대카드, 보상의 문제 등 DBR 5월 2부 ~ 6월 1부에서 건진 내용들 5월 2부- 날씨 마케팅 : 날씨가 화창할 경우, 장바구니 이탈 감소 → 소비자의 긍정적인 기분을 높여줌  * 단, 브랜드 가치가 높을수록 효과는 떨어짐 - 현대카드 : 꼴찌의 진격  * 현대카드는 출범 당시 카드사 중 제일 낮은 점유율  * 'M 포인트' : 현대, 기아차 신차 구입 시 할인 혜택, 항공권, 온라인 쇼핑 때 활용 → 포인트 중심 → 충성도 UP  * 고객 개인의 라이프 스타일에 맞춘 실질적 혜택에 초점  * '더 블랙' 프리미엄으로 수직 성장 → 프리미엄 고객군 확보  * 문화 마케팅 '슈퍼 시리즈'  * '공간'을 통한 지속적 접점 추구  * 독점적 파트너쉽 : 이마트  * 애플페이 - 일본의 빈집 문제 해결 : 고령화, 저출산으로 빈집..
밀리의 서재, 올리브영, 제무재표의 문제점, ... DBR 2월 2부 ~ 4월 2부까지 건진 내용들 2월 2부 - 27세가 넘으면 정서적 몰입도가 커져서 충성 고객이 될 가능성이 높아짐 - 팝업스토어의 최종 목표는 가치 있다는 인식을 디자인하는 것 * 마케팅, 브랜딩적인 관점이 아니라 도시학적 관점으로도 볼 수 있음 * 도시와의 컨텍스트, 도시의 파사드를 고려해서 팝업스토어의 위치를 선정해 사람들의 기억에 남게 하는 것 3월 1부 -  일론 머스크는 강박적 불안증이 있고, 마이크로 매니지먼트를 즐겨하며, 자신의 취약성을 잘 드러내는 리더 : 이러한 점들이 새로운 사업의 기회와 성공을 만들어낸 것일 수도 있음 3월 2부 - 올리브영은 성장세를 유지하면서 최대 실적을 기록 * 퀵커머스의 확대 : '오늘드림' 서비스 도임 * IT 핵심 인력 내재화 및 초개인화..