Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Feat] 타 벤치마크 데이터셋 증강 코드 추가 #66

Merged
merged 9 commits into from
Dec 3, 2024

Conversation

chell9999
Copy link
Contributor

📝 Summary

타 벤치마크 증강 실험 후 점수 향상이 있었던 HAE-RAE 데이터셋 증강 코드 추가

✅ Checklist

  • 관련 이슈가 명시되어 있습니다.
  • 테스트가 완료되었습니다.
    - [ ] 문서 업데이트가 포함되었습니다.
  • 코드 리뷰를 위한 사전 검토를 완료했습니다.

📄 Description

HAE-RAE 데이터셋을 내부 카테고리 별로 형태를 가공하고 train 데이터셋에 취합하는 코드입니다.

💡 Notice (Optional)

해당 코드 실행 시 필요한 데이터셋은 규정 상 레포에 업로드 불가합니다.

🔗 Related Issue(s)

close #62

@chell9999 chell9999 added Priority: Medium 적절한 시기에 처리해야 할 작업 Type: Enhancement 기능 개선 작업 labels Dec 3, 2024
@chell9999 chell9999 self-assigned this Dec 3, 2024
@chell9999 chell9999 changed the title [Feat] HAE-RAE 벤치마크 데이터셋 증강 코드 추가 [Feat] 타 벤치마크 데이터셋 증강 코드 추가 Dec 3, 2024
Copy link
Contributor

@eyeol eyeol left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

주석 덕분에 코드 편하게 읽었습니다. 고생하셨습니다!!

Copy link
Contributor

@jagaldol jagaldol left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

리뷰 확인부탁드립니다~


# HAERAE 데이터를 모두 넣어줄 빈 데이터셋을 선언한다
train_agg = pd.read_csv("./data/agg_other_benchmarks/train_agg.csv")
data_haerae_agg = pd.DataFrame(columns=train_agg.columns)
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

코드 실행 문들을 if __name__ == "__main__":으로 감싸는게 어떨까요?

if name == “main”은 왜 필요한지에 대해 알아보자



# 저장할 파일명을 선언해준다
def get_category_initials(name):
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

이 함수는 선언 위치를 위쪽 함수들이 존재하는 곳으로 옮기면 좋을 것 같아요

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

좋은 피드백 감사합니다~ 수정 완료 됐습니다!

@chell9999 chell9999 merged commit 897ebc0 into main Dec 3, 2024
3 checks passed
@chell9999 chell9999 deleted the feature/62-aug-other-benchmarks branch December 3, 2024 07:03
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Priority: Medium 적절한 시기에 처리해야 할 작업 Type: Enhancement 기능 개선 작업
Projects
None yet
Development

Successfully merging this pull request may close these issues.

[FEAT] KMMLU 논문에서 소개된 타 벤치마크 데이터셋들 취합
4 participants