๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

NLP

(2)
์‹ฌ๋ฆฌ ์ผ€์–ด ์ฑ—๋ด‡(kogpt2, kobert) ๊ตฌํ˜„ํ•ด ๋ฐฐํฌํ•ด๋ณด์ž [1] kogpt2 ๊ธฐ๋ฐ˜ ์‹ฌ๋ฆฌ ์ผ€์–ด ์ฑ—๋ด‡ ํ•œ์ค„ ์„ค๋ช… KoGPT2 ๋ชจ๋ธ์€ ๋ฌธ์žฅ์„ "์ƒ์„ฑ"ํ•ด๋‚ด๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์‹ฌ๋ฆฌ ์ผ€์–ด ๋ชฉ์ ์˜ ์ฑ—๋ด‡์„ ๊ตฌํ˜„ํ•˜๊ธฐ ์œ„ํ•ด ์ž…๋ ฅ ๋ฐ›์€ ๋‚ด์šฉ์— ๋Œ€ํ•ด ์œ„๋กœํ•˜๊ฑฐ๋‚˜ ๊ณต๊ฐํ•˜๊ฑฐ๋‚˜ ๋ถ€๋“œ๋Ÿฌ์šด ํ‘œํ˜„์œผ๋กœ ๋ฐ˜์‘ํ•˜๊ณ  ๋ฌธ์žฅ์„ ์ƒ์„ฑํ•ด๋‚ด๋„๋ก ํŒŒ์ธ ํŠœ๋‹์„ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•™์Šต ์ฝ”๋“œ ๋งํฌ์ž…๋‹ˆ๋‹ค. ์‚ฌ์šฉํ•œ ๋ฐ์ดํ„ฐ์…‹ 1. ai hub ์ œ๊ณต, ์›ฐ๋‹ˆ์Šค ๋Œ€ํ™” ์Šคํฌ๋ฆฝํŠธ ๋ฐ์ดํ„ฐ์…‹ AI hub > ์™ธ๋ถ€๋ฐ์ดํ„ฐ > KETI R&D๋ฐ์ดํ„ฐ >์ธ์‹๊ธฐ์ˆ (์–ธ์–ด์ง€๋Šฅ) > ์›ฐ๋‹ˆ์Šค ๋Œ€ํ™” ์Šคํฌ๋ฆฝํŠธ ๋ฐ์ดํ„ฐ์…‹ 2. @songys (์†ก์˜์ˆ™๋‹˜) ์ œ๊ณต, ์ฑ—๋ด‡ ๋ฐ์ดํ„ฐ์…‹ ๋‘ ๋ฐ์ดํ„ฐ๋ฅผ ์•„๋ž˜์˜ ๋ฐ์ดํ„ฐ ํ˜•์‹์— ๋งž๊ฒŒ ๊ฐ€๊ณตํ–ˆ์Šต๋‹ˆ๋‹ค. ํ•™์Šต ํ™˜๊ฒฝ colab ๊ธฐ๋ณธ ํ™˜๊ฒฝ์—์„œ๋„ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค๋งŒ, ์‹œ๊ฐ„์ด ๊ฝค ์˜ค๋ž˜๊ฑธ๋ฆฌ๋Š” ํŽธ์ž…๋‹ˆ๋‹ค! 1 epoch์— 15~16๋ถ„ ์ •๋„ ๊ฑธ๋ฆฌ๋Š”๋ฐ epoch ์ตœ..
[Python, KoBERT] ๋‹ค์ค‘ ๊ฐ์ • ๋ถ„๋ฅ˜ ๋ชจ๋ธ ๊ตฌํ˜„ํ•˜๊ธฐ (huggingface๋กœ ์ด์ „ ๋ฐฉ๋ฒ• O) 1. BERT, KoBERT๋ž€? ๊ตฌ๊ธ€์—์„œ 2018๋…„์— ๊ณต๊ฐœํ•œ BERT๋Š” ๋“ฑ์žฅ๊ณผ ๋™์‹œ์— ์ˆ˜๋งŽ์€ NLP ํƒœ์Šคํฌ์—์„œ ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋ฉด์„œ NLP์˜ ํ•œ ํš์„ ๊ทธ์€ ๋ชจ๋ธ๋กœ ํ‰๊ฐ€๋ฐ›๊ณ  ์žˆ๋‹ค. ์–‘๋ฐฉํ–ฅ์„ฑ์„ ์ง€ํ–ฅํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.(B: bidirection) BERT ๋ชจ๋ธ์€ ๋ฌธ๋งฅ ํŠน์„ฑ์„ ํ™œ์šฉํ•˜๊ณ  ์žˆ๊ณ , ๋Œ€์šฉ๋Ÿ‰ ๋ง๋ญ‰์น˜๋กœ ์‚ฌ์ „ ํ•™์Šต์ด ์ด๋ฏธ ์ง„ํ–‰๋˜์–ด ์–ธ์–ด์— ๋Œ€ํ•œ ์ดํ•ด๋„๋„ ๋†’๋‹ค. ํ•˜์ง€๋งŒ BERT๋Š” ํ•œ๊ตญ์–ด์— ๋Œ€ํ•ด์„œ ์˜์–ด๋ณด๋‹ค ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์ง„๋‹ค๊ณ  ํ•œ๋‹ค. ์˜ค๋Š˜ ๊ธฐ์ˆ ํ•ด๋ณผ KoBERT ๋ชจ๋ธ์€ SKTBrain์—์„œ ๊ณต๊ฐœํ–ˆ๋Š”๋ฐ, ํ•œ๊ตญ์–ด ์œ„ํ‚ค 5๋ฐฑ๋งŒ ๋ฌธ์žฅ๊ณผ ํ•œ๊ตญ์–ด ๋‰ด์Šค 2์ฒœ๋งŒ ๋ฌธ์žฅ์„ ํ•™์Šตํ•œ ๋ชจ๋ธ์ด๋‹ค. ์ž์‹ ์˜ ์‚ฌ์šฉ ๋ชฉ์ ์— ๋”ฐ๋ผ ํŒŒ์ธํŠœ๋‹์ด ๊ฐ€๋Šฅํ•˜๊ธฐ ๋•Œ๋ฌธ์— output layer๋งŒ์„ ์ถ”๊ฐ€๋กœ ๋‹ฌ์•„์ฃผ๋ฉด ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์ถœ๋ ฅํ•ด๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ๋งŽ์€ BERT ..