Untuk memastikan, Sparrow tidak beperilaku yang membahayakan, para ahli DeepMind juga menentukan sejumlah rules/aturan, misalnya “jangan membuat pernyataan yang mengancam” atau “jangan memberikan komentar yang bernada benci atau menghina.” Ada 23 rules yang “membentengi” perilaku model chatbot ini. Dikutip dari website Life Architect, ke-23 rules ini kebanyakan didesain oleh para peneliti dari DeepMind, California Institute of Technolgy, University of Toronto, dan University College Dublin.
Kalau ChatGPT menggunakan GPT-3.5, Sparrow dikembangkan berdasarkan LLM Chinchilla. Model bahasa ini kemudian dilatih dengan teknik RL. Oleh karena itu, Sparrow juga sering disebut sebagai DPC, Dialogue-Prompted Chinchilla. Sedikit mengenai Chinchilla, LLM ini adalah compute-optimal model yang dikembangkan oleh DeepMind.
Tujuan pengembangan Chinchilla adalah membuktikan bahwa peningkatan skala model bukan satu-satunya cara untuk mendongkrak kinerja LLM. Dengan hanya 70 miliar parameter tapi dilatih dengan jumlah data yang lebih banyak, Chinchilla disebut Deepmind dapat mengungguli kinerja LLM lainnya, yaitu Gopher (280 miliar parameter); GPT-3 (175 miliar parameter), Jurassic-1 (178 milar parameter), dan Megatron-Turing NLG (530 miliar parameter).