재미난 공부들/세미나 및 교육 기록 10

기업 공시 데이터 (재무데이터) 분석을 위한 dart-fss 패키지

https://dart-fss.readthedocs.io/en/latest/ DART-FSS — dart-fss documentation v0.3.10 documentation © Copyright 2021, Sungwoo Jo Revision 60fa916c. dart-fss.readthedocs.io 대한민국 금융감독원에서 운영하는 다트(DART) 사이트 크롤링 및 재무제표 추출을 위한 라이브러리. 물론 직접 코드를 짜는 것 보다는 디테일면에서 떨어지겠지만 정말 편하다. 어짜피 재무데이터라고 하면 가져오는 데이터가 비슷비슷 하기 때문에 라이브러리를 쓰는 것도 좋은 선택일 것 같음.

[합격/탈락 이진 분류모델]을 통해 [Confusion Matrix 해석, Precision&Recall] 알아보기

*실제로 밸런스가 깨진 데이터의 성능을 설명할 시 f1-score만 비교해주면 됩니다. 멘토링 시, 초심자 분들 께서는 Precision과 Recall을 많이 궁금해 하셔서 그부분을 상세하게 설명할 예정입니다. *confusion matrix를 이해하고 계신 분들은 3. 무엇을 읽을 수 있는가? 부터 보시면 됩니다. 0. 맥락 이해하기 - 어떤 사람 Index데이터를 주면, AI알고리즘이 이 사람이 채용에 적합한지 부적합한지 (즉, 합격인지 탈락인지) 판단하는 이진 분류 알고리즘을 개발하려고 함. - 총 약 300명의 기존 채용 결과 데이터가 있으며, 이중 226명 데이터를 Train데이터로, 나머지를 Test데이터로 사용하여 알고리즘을 학습시키고 모델의 성능을 검증하려고 함. - 성능 검증을 왜 하나?..

[이스트소프트 AI Plus 2021] 간단 후기

기억에 남는 내용은.... 1. 메타버스 기술을 어떻게 정의할 것인가? 이 문제. 안그래도 예전에 관련 질문을 받았어서 메타버스가 뭔데? 로 질문이 거슬러 갔던 기억이 난다. 새로운 개념이라 학계에서 내린 정의는 명확하지 않은 듯 했고, 이스트소프트에서는 실제 실존인물 바탕인지/아예 가상의 허구인지 개념 + 실제 존재하는 동작등에 모션을 입혀서 처리하는지 아니면 따라할 대상(?) 이 없고 자체적으로 모션을 하는 것인지.. 이렇게 두가지 기준들로 메타버스기술들을 나눴던 것 같다. 이 과정에서 GAN등 '기존의 대상들로부터 새로운 대상을 -창조-' 할 수 있는 딥러닝 기술들도 언급했다. 2. 보안과 얼굴 인식 기술 관련.. 1) '다른 얼굴' 의 기준이 무엇인가? A사람이 찡그릴 때와 웃을 때는 분명 다른 ..

[원티드 Live: 데이터로 보는 인사 이야기] 후기 + 기록

설명된 키워드를 포함한 다양한 논의들이 나왔다. (키워드 설명은 웨비나에서 언급된 것과 필자의 주관적인 코멘트가 섞여 있습니다.) Digital Transformation (DT) 에 관하여: 1) DT는 한 2년 전부터 많이 회자되는 단어이기는 한데, 소스들마다 내용이 달라 헷갈렸었다. 이걸 명확하게 이야기 해주셔서 속이 시원했다. 2) 개념적으로 Digitization(아날로그 > 디지털로 넘어가는 것) / Digitalization (디지털기술 활용해서 운영방식 개선). 좀더 포괄적인 개념은 '기술을 이용해서/비즈니스 모델+커스터머를 포함한 다양한 변화를 관리하는 것' 3) Fag: '유행'; 맥락상 비즈니스에서의 일시적인 유행. DT가 유행인데 와~~유행이다~~ 하고 실질적인 변화 없이 무조건 도..

[멘토링] 반도체 인공지능 역량 강화교육

*2021-12-03 업데이트 모 기관의 반도체 공정 실무자 인공지능 역량강화 교육 과정에 멘토 자격으로 참가하여 프로젝트 튜터링을 했다. 이전 회사도 반도체업계였어서 내적 반가움이 컸다! 여러모로 멘토로서도 배운 것이 많은 교육이었기에, 이를 흘려보내기 아쉬워 반도체 데이터 분석 시 필요한 공정 도메인을 정리해보려 한다. 내가 공부하기 위해 만드는 자료라 내용이 계속 수정/업데이트 될 수 있다! 자.. 데이터 분석의 기본은 데이터에 대한 이해이다. (단, 문제 및 원인 정의, 관련 데이터 수집 단계를 제외한다는 전제이다. 프로젝트에 따라, 문제 정의 단계가 사전 설정되어 있다면 우리는 분석에만 초점을 맞추게 된다.) 이를 위해서는 데이터 인덱스가 생성, 축적, 업데이트, 삭제 되는 전 과정을 상상할 수..

[Data Robot 세미나] AI와 비판적 사고: 아마존 AI 인터뷰 폐지 3

Data Robot에서 주최한 웨비나 후기.. 내용 출처는 Data Robot 사 입니다. 어떤 형태로든 재배포가 안된다면 말씀 주세요. www.linkedin.com/posts/datarobot_how-to-stop-worrying-and-start-tackling-ai-activity-6732293497275117568-mOWM How to Stop Worrying and Start Tackling AI Bias?; 어떻게 하면 AI bias 에 대한 걱정을 멈추고, 해결을 도모할 수 있을까? ⭐️꼭지 4. bias에 관해 우리가 생각해야 할 것 1) bias의 발생 자체가 문제인가? 발표자는 bias = malfunctioning 은 아니라고 했다. 즉, 기능 자체에 문제가 없는 상태라는 것. 기계..

[Data Robot 세미나] AI와 비판적 사고: 아마존 AI 인터뷰 폐지 2

Data Robot에서 주최한 웨비나 후기.. 알고있고 믿고 있던 것과 다른 점이 있어 흥미로웠다. 심지어 내가 쓴 앞의 포스팅 내용과도 다르다..! 조금 당황스럽다..ㅎ 내용 출처는 Data Robot 사 입니다. 어떤 형태로든 재배포가 안된다면 말씀 주세요. www.linkedin.com/posts/datarobot_how-to-stop-worrying-and-start-tackling-ai-activity-6732293497275117568-mOWM How to Stop Worrying and Start Tackling AI Bias?; 어떻게 하면 AI bias 에 대한 걱정을 멈추고, 해결을 도모할 수 있을까? 앞선 포스팅에서 머신러닝의 한계를 언급하고 끝났는데 일맥상통한다. 정리하고픈 주제 몇..

[Data Robot 관련] AI와 비판적 사고: 아마존 AI 인터뷰 폐지 1

**내용 편집: 11/2020 일부 수정 및 이미지 삭제 출처: 아마존 AI 채용, '여성 차별'문제로 폐기...머신러닝의 한계인가? (원뉴스: 로이터통신 Amazon scraps secret AI recruiting tool that showed bias against women) www.womentimes.co.kr/news/articleView.html?idxno=42020 www.reuters.com/article/us-amazon-com-jobs-automation-insight-idUSKCN1MK08G AI에게 의사결정에 있어 어느정도까지 권한을 줄 수 있는가? 에 대한 생각이 많았었다. 공부를 해 보니, 아니... 얘가 왜 이런 결정을 내렸는지도 모르겠고... 너무 당연한 얘기인데 틀리다고 ..

[Workday live: Payroll and HR Trends] 간단 후기

Linkedin 에서 라이브한다고 팝업이 뜨길래 우연히 참석하게 되었다. 다들 Hi from ABC! 하는데 한국시간으로 새벽이었어서 그런지 나 말고 한국 분들은 안계셨다. 소심하게 Hello from Seoul (다른분들이 하니까 나도 함) 하고 열심히 들었다. 내용은, 아주 간단히 요약하자면 'Work from Home Strategy + 코로나 관련된 HR측면에서의 변화 대응 논의' 정도? 1. 여태까지 해왔던 Normal business continuity 를 지켜내야 하고, 아직 자원이나 시스템 셋업 (ex. payroll tracking) 이 미흡하고, 법적인 측면도 빠르게 변화할 것이라 예상되므로 (paid sick leave등) 잘 해결해 나가야 한다는 것. 한마디로 새로운 HR issue..

[Data and AI forum by IBM 2019] 후기

엄청 옛날에 다녀온 포럼인데 블로그에는 이제야 업데이트를 한다 :) 신청하고 나서 이것 저것 더블체킹하느라 가기 전부터 복잡했었는데 그래도 간 보람이 10000% 있었다. 걍 심심하고 궁금해서 혼자 가볼까? 하고 간건데 예상보다 훨씬 흥미로웠다. 1. 일단 행사가 전체적으로 세련되고 깔끔하게? Organize되어있다는? 느낌이 들었다. 2. 현직 Solution Consultant//Sales 분들이 직접 강의하시는 세션이 특히 좋았다. 내가 들었던 파트는 은행권 종사자 분들이 클라이언트인 듯 했는데 맨 앞자리에서 피드백 계속 하시면서 들으시길래 옆에서 주워듣는(?) 내용들이 많아서 더 좋았다! 3. 밥이 맛있었다. 4. 파트너사들의 툴 구경이 재미있었다. 5. 공학지식쪽으로 깊게 들어가면 이해할 수 없..