يستخدم مولد الأوصاف الصوتية تقنية الذكاء الاصطناعي لتحليل محتوى الفيديو وإنشاء روايات وصفية. يقوم بتحديد العناصر البصرية الأساسية، والأفعال، وتغيرات المشهد، ثم يولد نص. يتم تحويل هذا النص إلى صوت باستخدام تقنية تحويل النص إلى كلام، والتي تتزامن بعد ذلك مع الفيديو الأصلي. العملية تعمل على أتمتة ما كان في السابق مهمة يدوية ومستهلكة للوقت، مما يجعل محتوى الفيديو أكثر وصولًا للجمهور ذوي الإعاقة البصرية.