ํ๊ตญ์ด ๋ฐ์ดํฐ์ ๋ํด์ ํ ์คํธ ๋ถ์์ ํด๋ณด์. ์๋ ๋ฐ์ดํฐ๋ ํ๊ตญ์ด ๋ถ์ ํ์ต์ ์ํด ๋ค์ํ ๋ฐฉ์์ผ๋ก ์ฌ์ฉ๋๊ณ ์๋ค. ์ฌ๊ธฐ์๋ ํ๊ธ ๋ถ์์ ์ํด Konlpy๋ฅผ ์ฌ์ฉํ๊ณ , ํ ์ํ๋ก ์ผ๋ผ์ค๋ฅผ ์ด์ฉํด ๋ชจ๋ธ์ ๋ง๋ค๋๋ก ํ๊ฒ ๋ค.
๋ฐ์ดํฐ์
: Naver sentiment movie corpus
(๋ค์ด๋ก๋ ๋งํฌ : https://github.com/e9t/nsmc/)
NSMC ์ฝ์ด๊น์ง ์ฌ์ฉํ ์ ๋๋ก ๋ง์ด๋ค ์ฌ์ฉํ๋ ๋ฐ์ดํฐ ์ธ๋ฏ ์ถ๋ค.
๋ฐ์ดํฐ ์ค๋ช
์ํ ๋ฆฌ๋ทฐ ์ค ์ํ๋น 100๊ฐ์ ๋ฆฌ๋ทฐ์ด๊ณ ์ด 200,000๊ฐ์ ๋ฆฌ๋ทฐ(train:15๋ง, test:5๋ง)
1์ ~ 10์ ๊น์ง์ ํ์ ์ค์์ ์ค๋ฆฝ์ ์ธ ํ์ (5์ ~8์ )์ ์ ์ธํ๊ณ ๋ถ๋ฅ๋ฅผ ํ์๋ค.
- ๋ถ์ : 1์ ~ 4์
- ๊ธ์ : 9์ ~ 10์
์นผ๋์ ๋ณด: id, document, label
- id: ๋ฆฌ๋ทฐ ์์ด๋
- document: ๋ฆฌ๋ทฐ ๋ด์ฉ
- label: ๋ ์ด๋ธ (0: negative, 1: positive)
๊ฐ ํ์ผ์ ๋ํ ๋ฆฌ๋ทฐ ๊ฐฏ์
- ratings.txt: All 20๋ง
- ratings_test.txt: 5๋ง
- ratings_train.txt: 15๋ง
๋ชจ๋ ๋ฆฌ๋ทฐํ ์คํธ๋ 140์ ์ด๋ด์ด๊ณ , ๊ฐ ๊ฐ์ ๋ถ๋ฅ๋ ๋์ผํ๊ฒ ์ํ๋ง ๋๋ค.(i.e., random guess yields 50% accuracy)
- 10๋ง๊ฐ์ ๋ถ์ ์ ์ธ ๋ฆฌ๋ทฐ
- 10๋ง๊ฐ์ ๊ธ์ ์ ์ธ ๋ฆฌ๋ทฐ
- ์ค๋ฆฝ์ ์ธ ๋ฆฌ๋ทฐ๋ ์ ์ธ
๋ฐ์ดํฐ ์ค๋น
๋ค์ด๋ก๋ ๋ฐ์ ๋ฐ์ดํฐ๋ฅผ pandas๋ฅผ ์ด์ฉํด ์ฝ์ด๋ณด์. ํ๋ ๊ตฌ๋ฌธ์ด ํญ์ผ๋ก ๋์ด ์๊ธฐ ๋๋ฌธ์ \t
๋ก ๊ตฌ๋ถ์๋ฅผ ์ง์ ํด์ฃผ์ด์ผ ํ๋ค.
๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ
๋ฐ์ดํฐ๋ฅผ ํ์ต ์ํค๊ธฐ ์ํด ์ ์ฒ๋ฆฌ๋ฅผ ์งํํด์ผ ํ๋๋ฐ, Konlpy๋ฅผ ์ด์ฉํด ํํ์ ๋ถ์ ๋ฐ ํ์ฌ ํ๊น
์ ํ๋๋ก ํ์.
์์ด์ ๊ฒฝ์ฐ ์ฃผ์ด์ง ๋จ์ด์ ๋น๋๋ง์ ์ฌ์ฉํด์ ์ฒ๋ฆฌํด๋ ํฌ๊ฒ ๋ฌธ์ ๋ ์์ง๋ง ํ๊ตญ์ด๋ ์์ด์๋ ๋ฌ๋ฆฌ ๋์ด์ฐ๊ธฐ๋ก ์๋ฏธ๋ฅผ ๊ตฌ๋ถ์ง๊ธฐ์๋ ํ๊ณ๊ฐ ์๊ณ , ๋ฆฌ๋ทฐ ํน์ฑ์ ๋ง์ถค๋ฒ์ด๋ ๋์ด์ฐ๊ธฐ๊ฐ ์ ๋๋ก ๋์ด์์ง ์๋ ๊ฒฝ์ฐ๊ฐ ์์ ์ ์๊ธฐ ๋๋ฌธ์ ์ ํํ ๋ถ๋ฅ๋ฅผ ์ํด์๋ Konlpy๋ฅผ ์ด์ฉํ๋ ๊ฒ์ด ์ข๋ค.
Konlpy๋ ๋์ด์ฐ๊ธฐ ์๊ณ ๋ฆฌ์ฆ๊ณผ ์ ๊ทํ๋ฅผ ์ด์ฉํด์ ๋ง์ถค๋ฒ์ด ํ๋ฆฐ ๋ฌธ์ฅ๋ ์ด๋ ์ ๋ ๊ณ ์ณ์ฃผ๋ฉด์ ํํ์ ๋ถ์๊ณผ ํ์ฌ๋ฅผ ํ๊น ํด์ฃผ๋ ์ฌ๋ฌ ํด๋์ค๋ฅผ ์ ๊ณตํ๊ณ ์๋ค.^^!
[('ํ๋ค๋ฆฌ๋', 'Verb'),
('๊ฝ', 'Noun'),
('๋ค', 'Suffix'),
('์', 'Noun'),
('์์', 'Josa'),
('๋ค', 'Noun'),
('์ดํธ', 'Noun'),
('ํฅ', 'Noun'),
('์ด', 'Josa'),
('๋๊ปด์ง๊ฑฐ์ผ', 'Verb')]
ํ ์คํธ ์ผ์ ๊ฐ๋จํ ๋ฌธ์ฅ์ ๋ฃ๊ณ ํ์ธ ํด๋ณด๋ฉด ์ด๋ฐ ํํ๋ก ๋ถ๋ฆฌ๋ฅผ ํด์ฃผ๋ ๊ฒ์ ์์ ์๋ค.
ํ ํฌ๋์ด์ฆ ํจ์๋ฅผ ๋ง๋ค์ด ์ฌ์ฉํ๋๋ก ํ๋ค.
norm์ ์ ๊ทํ, stem์ ๊ทผ์ด๋ก ํ์ํ๊ธฐ๋ฅผ ๋ํ๋
๋ฆฌ๋ทฐ๊ฐ null์ธ ๊ฒฝ์ฐ ์ ์ ํจ์์์ ์ค๋ฅ๊ฐ ๋ฐ์ํ ์ ์์ผ๋ ์ฌ์ ์ null๊ฐ ํ์ธํด๋ณด๊ณ ๋น๋ฏผ์์ด๋ก ๋์ฒดํ์!
์ด์ ํ์ต๋ฐ์ดํฐ์ ํ ์คํธ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ์ฌ ์ ์ฅํด๋์.
๋ถ์๊ฒฐ๊ณผ๊ฐ ๋๋ฌ์ผ๋ฉด ๋ค์๊ณผ ๊ฐ์ ํํ๋ก ๋ฐ์ดํฐ๊ฐ ๋ณํ ๋์์ ๊ฒ์ด๋ค.
(['์/Exclamation', '๋๋น/Noun', '../Punctuation', '์ง์ง/Noun', '์ง์ฆ๋๋ค/Adjective', '๋ชฉ์๋ฆฌ/Noun'], 0)
(['๊ตณ๋ค/Adjective', 'ใ
/KoreanParticle'], 1)
15๋ง ํ์ต๋ฐ์ดํฐ์ ๋ถ๋ฆฌ๋ ํ ํฐ ๊ฐ์๋ฅผ ์ดํด๋ณด์.
ํ ํฐ๊ฐ์: 2159921
์ด์ ์ด๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ nltk๋ฅผ ์ด์ฉํด ์ ์ฒ๋ฆฌ๋ฅผ ํ๋ค. Text
ํด๋์ค๋ ๋ฌธ์๋ฅผ ํธ๋ฆฌํ๊ฒ ํ์ํ ์ ์๋ ๋ค์ํ ๊ธฐ๋ฅ์ ์ ๊ณตํ๊ณ ์๋ค.
์ฌ๊ธฐ์๋ vocab().most_common
๋งค์๋๋ฅผ ์ด์ฉํด ๋ฐ์ดํฐ๊ฐ ๊ฐ์ฅ ์์ฃผ ์ฌ์ฉ๋๋ ๋จ์ด๋ฅผ ๊ฐ์ ธ์ฌ ๋ ์ฌ์ฉํ๊ฒ ๋ค.
2159921
49894
[('./Punctuation', 67778), ('์ํ/Noun', 50818), ('ํ๋ค/Verb', 41209), ('์ด/Josa', 38540), ('๋ณด๋ค/Verb', 38538), ('์/Josa', 30188), ('../Punctuation', 29055), ('๊ฐ/Josa', 26627), ('์/Josa', 26468), ('์/Josa', 23118)]
๋ฐ์ดํฐ ํ์
์ถ๋ ฅ๋น๋๊ฐ ๋์ ์์ ํ ํฐ 10๊ฐ๋ฅผ matplotlib์ ์ด์ฉํด ๊ทธ๋ํ๋ก ํ์ธํด๋ณด์.
png
๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ํด ๋ฐฑํฐํ๋ฅผ ํด์ผ ํ๋๋ฐ, ์์ฃผ ์ฌ์ฉ๋๋ ํ ํฐ 10000๊ฐ๋ฅผ ์ฌ์ฉํด ๋ฐ์ดํฐ๋ฅผ ๋ฐฑํฐํ ํ์.(์ ํซ ์ธ์ฝ๋ฉ ๋์ CountVectorization์ ์ฌ์ฉ)
๋ฌธ์ ์งํฉ์์ ๋จ์ด ํ ํฐ์ ์์ฑํ๊ณ ๊ฐ ๋จ์ด์ ์๋ฅผ ์ธ์ด BOW(Bag of Words) ์ธ์ฝ๋ฉํ ๋ฒกํฐ๋ฅผ ๋ง๋๋ ์ญํ ์ ํ๋ค.
์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฌ๋ฏ๋ก 100๊ฐ๋ง ํด๋ณด์...
์ด ๊ณผ์ ์ ๋ฐ์ดํฐ ์์ด ํฐ ๋งํผ ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฌ๊ธฐ ๋๋ฌธ์ ์ด ์์ ์ ๋ฐ๋ณตํ์ง ์๋๋ก ํ๊น ์ ๋ง์น ํ์๋ jsonํ์ผ๋ก ์ ์ฅํ๋ ๊ฒ๋ ์ข์ ๋ฐฉ๋ฒ์ด๋ค.
๋ฌธ์์์ ์์๋ก ์ ํ๋ ๋จ์ด๋ค์ค ๋ช๊ฐ๊ฐ ํฌํจ์ด ๋๋์ง๋ฅผ ์์์ผ ํ๋ค.
์ด๋ ๊ฒ ํ๋ฉด x์ถ ๋ฐ์ดํฐ์๋ ๋จ์ด๋ค์ด ๋น๋์ ์ ๋ณด?, y์ถ์๋ ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ฅผ ๊น๋ํ๊ฒ ์ ๋ฆฌํ ์ ์๋ค.
์ด์ ๋ฐ์ดํฐ๋ฅผ float๋ก ํ ๋ณํ ์์ผ์ฃผ๋ฉด ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๋~~
๋ฐ์ดํฐ ๋ชจ๋ธ๋ง
ํ ์ํ๋ก ์ผ๋ผ์ค๋ฅผ ์ด์ฉํด ๋ชจ๋ธ์ ๋ง๋ค์ด ๋ณด์.
๋ ์ด์ด ๊ตฌ์ฑ์ ๋๊ฐ์ Danse์ธต์ 64๊ฐ์ ์ ๋์ ๊ฐ์ง๊ณ ํ์ฑํจ์๋ relu๋ฅผ ์ฌ์ฉํ๊ณ , ๋ง์ง๋ง์ธต์ sigmoid ํ์ฑํ ํจ์๋ฅผ ์ฌ์ฉํด ๊ธ์ ๋ฆฌ๋ทฐ์ผ ํ๋ฅ ์ ์ถ๋ ฅํ ๊ฒ์ด๋ค.
์์ค ํจ์๋ binary_crossentropy, RMSprop ์ตํฐ๋ง์ด์ ๋ฅผ ํตํด ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ์งํ
๋ฐฐ์น ์ฌ์ด์ฆ๋ 512, ์ํฌํฌ๋ 10๋ฒ์ผ๋ก ํ์ต
์, ์ด์ ํ์ต์ ์์ผ ๋ชจ๋ธ์ ๋ง๋ค์ด ๋ณด์! ๋จผ๊ฐ ์์ด ๋ณด์ด๋ ์งํ๋ฅ ์ํ๋ฅผ ๋ณผ ์ ์๋ค.:)
WARNING:tensorflow:From C:\Users\DESKTOP.conda\envs\nlp\lib\site-packages\tensorflow\python\ops\math_ops.py:3066: to_int32 (from tensorflow.python.ops.math_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.cast instead.
Epoch 1/10
150000/150000 [==============================] - 17s 115us/sample - loss: 0.5611 - binary_accuracy: 0.6948s - loss: 0.6134 - binary_accuracy: - ETA: 21s - loss: 0.6108 - binary_accuracy: 0. - ETA: 20s - - ETA: 15s - loss: 0.5957 - binary_accuracy: 0.67 - ETA: 15s - loss: 0.5955 - binary_accuracy: 0.67 - ETA: 15s - loss: 0.5951 - binary_accura - ETA: 14s - loss: 0.5930 - binary_accuracy: 0. - ETA: 14s - loss: 0.5923 - binary_accuracy: - ETA: 13s - loss: 0.5911 - binary_accura - ETA: 8s - loss: 0.5785 - binary_accuracy: 0. - ETA: 8s - loss: 0.5771 - binary_accuracy: 0.68 - ETA: 8s - loss: 0.5764 - binary_accuracy: - ETA: 7s - loss: 0.5751 - binary_accura - ETA: 6s - loss: 0.5727 - binary_accuracy: - ETA: 6s - loss: 0.5713 - binary_accuracy: 0.6 - ETA: 5s - loss: 0.5708 - binary_a - ETA: 4s - loss: 0.5685 - binary_accuracy: - ETA: 4s - loss: 0.5676 - binary_accuracy: 0.691 - ETA: 4s - loss: 0.5674 - binary_a - ETA: 2s - loss: 0.5652 - binary_accuracy: 0.692 - ETA: 2s - loss: 0.5651 - binary_accurac - ETA: 1s - loss: 0.5639 - binary_accuracy - ETA: 1s - loss: 0.5628 - binary_accuracy: 0.694 - ETA: 1s - loss: 0.5627 - binary_accuracy: 0.694 - ETA: 1s - loss: 0.5626 - binary_accuracy: 0.694 - ETA: 1s - loss: 0.5623 - binary_accuracy: 0.694 - ETA: 1s - loss: 0.5623 - binary_accuracy: - ETA: 0s - loss: 0.5615 - binary_accuracy: 0.69 - ETA: 0s - loss: 0.5612 - binary_accuracy: 0.694 - ETA: 0s - loss: 0.5613 - binary_accuracy: 0.6
Epoch 2/10
150000/150000 [==============================] - 12s 83us/sample - loss: 0.5313 - binary_accuracy: 0.71254s - loss: 0.5221 - binary_ac - ETA: 15s - loss: 0.5345 - binary_accuracy: - ETA: 16s - loss: 0.5377 - binary_accuracy - ETA: 14s - loss - ETA: 13s - lo - ETA: 7s - loss: 0.5341 - binary_accuracy: 0.71 - ETA: 7s - - ETA: 4s - loss: 0.5340 - binary_accur - ETA: 3s - loss: 0.5335 - binary_accuracy: 0.71 - ETA: 3s - loss: 0.5335 - binary_ - ETA: 2s - loss: 0.5325 - binary_accuracy: 0 - ETA: 1s - loss: 0.
Epoch 3/10
150000/150000 [==============================] - 13s 86us/sample - loss: 0.5236 - binary_accuracy: 0.7170s - loss: 0.5284 - binary_accuracy - ETA: 10s - los - ETA: 9s - loss: 0.5255 - binary_accurac - ETA: 9s - loss: 0.5250 - binary_accuracy: 0. - ETA: 9s - loss: 0.5255 - binary_accuracy: 0.716 - ETA: 9s - loss: 0.5254 - binary - ETA: 8s - loss: 0.5247 - binary_acc - ETA: 7s - loss: 0.5251 - binary_accuracy: 0.7 - ETA: 7s - loss: 0.5252 - binary_accuracy: 0.71 - ETA: 7s - loss: 0.5249 - binary_accuracy: 0.716 - ETA: 7s - loss: 0.5248 - binary_accuracy: 0.7 - ETA: 6s - loss: 0.5245 - binary_accuracy: - ETA: 6s - loss: 0.5246 - binary_accuracy: 0 - ETA: 5s - loss: 0.5247 - bina - ETA: 5s - loss: 0.5249 - b - ETA: 3s - loss: 0.5246 - binary_ac - ETA: 2s - loss: 0.5246 - binary_ac - ETA: 2s - loss: 0.5244 - binary_accuracy: 0.71 - ETA: 2s - loss: 0.5244 - binary_accuracy: - ETA: 1s - loss: 0.5242 - binary_accur - ETA: 1s - loss: 0.5243 - binary_accuracy: 0 - ETA: 0s - loss: 0.5243 - binary_accuracy - ETA: 0s - loss: 0.5239 - binary_accuracy: 0.7 - ETA: 0s - loss: 0.5237 - binary_accuracy: 0.7 - ETA: 0s - loss: 0.5236 - binary_accuracy: 0.71
Epoch 4/10
150000/150000 [==============================] - 13s 89us/sample - loss: 0.5179 - binary_accuracy: 0.7219s - loss: 0.5201 - binary_accuracy: 0 - ETA: 8s - loss: 0.5211 - binary_a - ETA: 9s - loss: 0.5208 - binary_accuracy: 0.721 - ETA: 8s - loss: 0.5201 - binary_accuracy: 0.72 - ETA: 8s - loss: 0.5210 - - ETA: 7s - loss: 0.5180 - binary_ac - ETA: 7s - loss: 0.5187 - binar - ETA: 6s - loss: 0.5186 - binary_accura - ETA: 6s - loss: 0.5183 - binary_accuracy: 0.7 - ETA: 6s - loss: 0.5182 - binary_ac - ETA: 5s - loss: 0.5179 - binary_accuracy: 0.723 - ETA: 5s - loss: 0.5179 - binary_accurac - ETA: 4s - loss: 0.5187 - binary_accuracy: 0.722 - ETA: 4s - lo
Epoch 5/10
150000/150000 [==============================] - 13s 87us/sample - loss: 0.5132 - binary_accuracy: 0.72531s - loss: 0.5093 - binary_accuracy: 0.72 - ETA: 11s - ETA: 9s - loss: 0.5156 - binary_accuracy: 0.7 - ETA: 9s - loss: 0.5163 - binary_accuracy: - ETA: 9s - loss: 0.5154 - binary_accurac - ETA: 8s - loss: 0.5164 - bin - ETA: 7s - loss: 0.5156 - binary - ETA: 6s - loss: 0.5168 - binary_accuracy: 0. - ETA: 6s - loss: 0.5163 - binary_accuracy: 0.72 - ETA: 6s - loss: 0.5160 - binary_accur - ETA: 5s - loss: 0.5154 - binary_accuracy: 0.723 - ETA: 5s - loss: 0.5153 - binary_a - ETA: 4s - los - ETA: 2s - loss: 0.5136 - binary_acc - ETA: 1s - loss: 0.5135 - binary_accuracy: 0.724 - ETA: 1s - loss: 0.5134 - binary_accuracy - ETA: 1s - loss: 0.5132 - binary_ac
Epoch 6/10
150000/150000 [==============================] - 13s 87us/sample - loss: 0.5094 - binary_accuracy: 0.72850s - loss: 0.4971 - binary_accuracy: 0.73 - ETA: 11s - loss: 0.5000 - binary_ - ETA: 9s - loss: 0.5043 - binary_accuracy: - ETA: 10s - loss: 0.5081 - binary_accuracy: - ETA: 9s - loss: 0.5086 - binary_a - ETA: 9s - loss: 0.5106 - binary_accuracy: 0 - ETA: 9s - loss: 0.5111 - binary_accuracy: 0.72 - ETA: 9s - loss: 0.5112 - binary_accuracy: - ETA: 9s - loss: 0.5122 - binary_accuracy: 0.724 - ETA: 9s - loss: 0.5122 - binary_accuracy: - ETA: 8s - loss: 0.5114 - binary_accuracy: 0. - ETA: 8s - loss: 0.5115 - binary_accuracy: 0. - ETA: 8s - loss: 0.5118 - binary_accuracy: 0 - ETA: 8s - loss: 0.5111 - binary_accuracy: 0.725 - ETA: 8s - loss: 0.5114 - - ETA: 6s - loss: 0.5099 - binary_accuracy - ETA: 6s - loss: 0.5108 - binary_accuracy - ETA: 5s - loss: 0.5100 - binary_accuracy: 0.726 - ETA: 5s - loss: 0.5102 - binary_acc - ETA: 4s - loss: 0.5102 - binary_accurac - ETA: 4s - loss: 0.5102 - binary_accuracy: 0.7 - ETA: 4s - l - ETA: 1s - loss: 0.5102 - binary_accu - ETA: 1s - loss: 0.5098 - bi - ETA: 0s - loss: 0.5094 - binary_accuracy: 0.72
Epoch 7/10
150000/150000 [==============================] - 12s 79us/sample - loss: 0.5064 - binary_accuracy: 0.73061s - loss: 0.5050 - binary_accura - ETA: 9s - loss: 0.5096 - binary_accuracy: 0.72 - ETA: 9s - loss: 0.5090 - binary_accuracy - ETA: 8s - loss: 0.5083 - binary_accuracy: 0.7 - ETA: 8s - loss: 0.5082 - binary_accuracy: 0.7 - ETA: 8s - loss: 0.5083 - binary_accur - ETA: 7s - loss: 0.5085 - binary_accuracy: 0 - ETA: 6s - loss: 0.5079 - binary_a - ETA: 5s - loss: 0.5079 - binary_accuracy: 0. - ETA: 5s - loss: 0.5080 - binary_accuracy: - ETA: 5s - loss: 0.5078 - binary_accuracy - ETA: 4s - loss: 0.5081 - binary_accuracy: 0 - ETA: 4s - loss: 0.5080 - binary_accuracy: 0.730 - ETA: 4s - loss: 0.5080 - binary_accuracy: 0.730 - ETA: 4s - loss: 0.5078 - binary_accuracy: - ETA: 4s - loss: 0.5072 - binary_accuracy: 0 - ETA: 3s - loss: 0.5072 - binary_ - ETA: 2s - lo - ETA: 0s - loss: 0.5064 - binary_accuracy: 0.730
Epoch 8/10
150000/150000 [==============================] - 13s 85us/sample - loss: 0.5037 - binary_accuracy: 0.73210s - loss: 0.5053 - binary_acc - ETA: 9s - loss: 0.5045 - binary_accuracy: - ETA: 9s - loss: 0.5024 - binary_accu - ETA: 8s - loss: 0.5013 - binary_accu - ETA: 8s - loss: 0.5014 - binary_accuracy: 0.73 - ETA: 8s - loss: 0.5007 - binar - ETA: 6s - loss: 0.5013 - binary_a - ETA: 6s - loss: 0.5016 - binary_accuracy: - ETA: 6s - loss: 0.5019 - binary_accuracy: 0.73 - ETA: 5s - loss: 0.5019 - binary_accuracy: 0 - ETA: 5s - loss: 0.5023 - binary_accuracy: 0.73 - ETA: 5s - loss: 0.5021 - binary_accuracy: 0.73 - ETA: 5s - l - ETA: 3s - loss: 0.5027 - ETA: 2s - loss: 0.5036 - binary_accuracy: - ETA: 2s - loss: 0.5033 - binary_accuracy: 0.732 - ETA: 2s - loss: 0.5033 - binary_accuracy: 0.73 - ETA: 2s - loss: 0.5034 - binary_accur - ETA: 1s - loss: 0.5035 - binary_accuracy: - ETA: 0s - loss: 0.5033 - binary_accuracy: - ETA: 0s - loss: 0.5035 - binary_acc
Epoch 9/10
150000/150000 [==============================] - 13s 85us/sample - loss: 0.5015 - binary_accuracy: 0.7337s - loss: 0.5023 - binary_accu - ETA: 13s - loss: 0.4956 - binary_accuracy: 0. - ETA: 14s - loss: 0.4949 - binary_accu - ETA: 15s - loss: 0.4938 - binary_accuracy: 0. - ETA: 15s - loss: 0.4977 - binary_accuracy: 0.73 - ETA: 15s - loss: 0.4981 - binary_accuracy: 0. - ETA: 14s - loss: - ETA: 12s - loss: 0.4989 - binary_accuracy - ETA: 12s - loss: 0.4992 - binary_accuracy - ETA: 11s - loss: 0.4990 - binary_ - ETA: 10s - loss: 0.4982 - binary_accuracy: 0.73 - ETA: 10s - loss: 0.4982 - binar - ETA: 9s - loss: 0.4997 - binary_accuracy: 0. - ETA: 9s - loss: 0.4997 - binary_accuracy: 0 - ETA: 8s - loss: 0.4996 - binary_accuracy: 0.7 - ETA: 8s - loss: 0.4997 - binary - ETA: 7s - loss: 0.5011 - bina - ETA: 6s - loss: 0.5014 - binary_accuracy: 0.7 - ETA: 6s - loss: 0.5011 - binary_ - ETA: 4s - loss: 0.5016 - binary_accuracy: 0.733 - ETA: 4s - loss: 0.5017 - binary_accurac - ETA: 4s - loss: 0.5018 - binary_ac - ETA: 2s - loss: 0.5022 - binary_accuracy: 0.7 - ETA: 2s - loss: 0.5023 - binary_accuracy: 0.73 - ETA: 2s - loss: 0.5021 - binary_accuracy: - ETA: 1s - loss: 0.5018 - binary_accuracy: 0 - ETA: 1s - loss: 0.5019 - binary_accuracy - ETA: 1s - loss: 0.5018 - binary_accuracy: 0.73 - ETA: 1s - loss: 0.5018 - binary_accuracy: 0.7 - ETA: 1s - loss: 0.5017 - binary_a
Epoch 10/10
150000/150000 [==============================] - 14s 91us/sample - loss: 0.4995 - binary_accuracy: 0.73620s - loss: 0.4948 - binary_accuracy: - ETA: 14s - loss: 0.4965 - binary_accura - ETA: 14s - loss: 0.4980 - binary_accu - ETA: 12s - loss: 0.4973 - binary_accuracy - ETA: 12s - loss: 0.5014 - binar - ETA: 12s - loss: 0.4992 - binary_accuracy - ETA: 12s - loss: 0.4996 - binary_accuracy: - ETA: 12s - loss: 0.5001 - binary_accuracy: 0.73 - ETA: 12s - loss: 0.5003 - binary_accura - ETA: 11s - loss: 0.5011 - b - ETA: 9s - loss: 0.5027 - binary_accuracy: - ETA: 9s - loss: 0.5026 - binary_accuracy - ETA: 8s - loss: 0.5013 - binary_accur - ETA: 8s - loss: - ETA: 6s - loss: 0.5013 - binary_ - ETA: 5s - loss: 0.5006 - binary_ac - ETA: 4s - loss: 0.4997 - binary_accurac - ETA: 4s - loss: 0.5001 - binary_ac - ETA: 3s - loss: 0.5001 - b - ETA: 1s - loss: 0.4989 - binary_accuracy: 0.736 - ETA: 1s - loss: 0.4989 - binary_accuracy: 0.736 - ETA: 1s - loss: 0.4988 - binary_accuracy: 0.736 - ETA: 1s - loss: 0.4989 - binary_accurac - ETA: 1s - loss: 0.4991 - binary_accuracy: 0. - ETA: 0s - loss: 0.4993 - binary_accura - ETA: 0s - loss: 0.4995 - binary_accuracy: 0.73
๋ชจ๋ธ ํ๊ฐ
ํ์ต๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ๋ชจ๋ธ ํ์ต์ด ๋๋ฌ๋ค๋ฉด ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ๋ชจ๋ธ์ ํ๊ฐํด๋ณด์.
50000/50000 [==============================] - 12s 234us/sample - loss: 0.5198 - binary_accuracy: 0.7184s - loss: 0.5197 - b - ETA: 11s - loss: 0.5199 - binary_accuracy: 0. - ETA: 1s - loss: 0.5198 - b
[0.5197769028568268, 0.71842]
์ฌ๊ธฐ์๋ 100๊ฑด์ผ๋ก ํ๊ธฐ๋๋ฌธ์ ์ข ๋ฎ์ 71%์ ์ ํ๋๊ฐ ๋์๋ค. ์๋ง ์ฌ์ฉํ ํ ํฐ์๋ฅผ 100๊ฐ๊ฐ ์๋ 10000๊ฐ๋ก ํ๋ค๋ฉด 85%์ ๋์ ์ ํ๋๋ฅผ ํ์ธํ ์ ์์ ๊ฒ์ด๋ค.
ํ์ผ๋ก ํ๋ค๊ฒ ๋ง๋ ๋ชจ๋ธ์ ์๋์ ๊ฐ์ด ์ ์ฅํด๋๊ณ ๋์ค์ ๋ก๋ํด์ ์ฌ์ฉํ ์ ์์ผ๋ ๊ผญ ์์๋์.
๊ฒฐ๊ณผ ์์ธกํ๊ธฐ
์ด์ ๋ฆฌ๋ทฐ ๋ฌธ์์ด์ ๋ฐ์ ๋ฐ๋ก ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๋ ํจ์๋ฅผ ๋ง๋ค์ด ๋ณด์
๋ฐ์ดํฐ ํํ๋ฅผ ๋ง์ถ๊ธฐ ์ํด np.expand_dims ๋งค์๋๋ฅผ ์ด์ฉํด array์ ์ถ์ ํ์ฅ ์์ผ์ฃผ์ด์ผ ํ๋ค.
์ต์ข ํ๋ฅ ์ด 0.5 ์ด์์ด๋ฉด ๊ธ์ , ๊ทธ๋ ์ง ์์ผ๋ฉด ๋ถ์ ์ด๋ผ๊ณ ์์ธก์ ํ๊ฒ ๋ค.
๋๋ต ํ ์คํธ๋ฅผ ๋จผ์ ํด๋ณด๊ณ ...
['์์ฃผ/Noun', '์ฌ๋ฏธ/Noun', '์๋ค/Adjective']
0.9102853536605835
ํ ์คํธํ ๋ก์ง์ ํจ์ํํด์ ์ฌ์ฉํ์.
์ฌ๋ฏธ ์ ๋ง ์์ด์ ==> ๋ถ์ (93%)
์ด์ ๋ฆฌ๋ทฐํ ์คํธ ๋ง์ผ๋ก ๊ธ์ ์ธ์ง ํน์ ๋ถ์ ์ธ์ง๋ฅผ ์ด๋์ ๋ ํ๋จ ํ ์ ์๊ฒ ๋์๋ค.
์ง๊ธ๊น์ง ์ํ๋ฆฌ๋ทฐ ๋ฐ์ดํฐ๋ฅผ ํตํด์ ๊ฐ์ ๋ถ์์ ํด๋ณด์๋๋ฐ ์ํ, ๊ฒ์, ์์๋ฑ์ ์ฌ์ฉ์ ์๊ฒฌ์ด ๋ด๊ธด ๋ฐ์ดํฐ๋ฅผ ์ ๋ชจ์์ ํ์ฉํ๋ค๋ฉด ๋ค์ํ ๊ณณ์ ํ์ฉํ ์ ์์ ๊ฒ์ด๋ค.