TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning

TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning. Gu, S., Knoll, A., & Jin, M. Transactions on Machine Learning Research, 2024.

Arxiv bibtex

@article{2024_4J_Teams,
  title={TeaMs-RL: Teaching LLMs to Generate Better Instruction Datasets via Reinforcement Learning},
  author={Gu, Shangding and Knoll, Alois and Jin, Ming},
  journal ={Transactions on Machine Learning Research},
  year={2024},
url_arXiv = {https://arxiv.org/abs/2403.08694}
}

Downloads: 0