google colab - GPU 기준으로 한 epoch당 33분 정도 소요
→ 학습 속도를 개선하기 위한 방법이 필요하다 생각됨.
→ 위와 같은 방법들로 build_model() 함수를 변경함.
‘robertaModel’의 미세 조정 대상 레이어를 지정함.
TFXLMRobertaModel.from_pretrained() 에서 ‘trainable 매개변수를 True로 설정함
→ 모든 레이어를 미세 조정함
trainable=True로 설정함
→ 일부 레이어만 미세조정
Example
robertaModel = TFXLMRobertaModel.from_pretrained(model_name, trainable=True)