ايران ويج

نسخه‌ی کامل: خواندن از روی یک متن
شما در حال مشاهده‌ی نسخه‌ی متنی این صفحه می‌باشید. مشاهده‌ی نسخه‌ی کامل با قالب بندی مناسب.
صفحه‌ها: 1 2
یه سورس می خام که یه متن انگلیسی بهش بدیم برامون بخونه
ممنون
یه طرح دارم برای خوارزمی
به قول دوستم میگه
"اگه تو بخای بری خارزمی .خارزمی کجا بره؟؟؟"
:oops: :oops: :oops: :oops:
Microsoft Agent
کد:
Microsoft Text to Speech
kkr124 نوشته است:یه سورس می خام که یه متن انگلیسی بهش بدیم برامون بخونه
ممنون
یه طرح دارم برای خوارزمی
به قول دوستم میگه
"اگه تو بخای بری خارزمی .خارزمی کجا بره؟؟؟"
:oops: :oops: :oops: :oops:

سلام
احتمالا منظور دوستمون خوندن به صورت فارسي بوده وگرنه خواندن به صورت انگليسي كه نرم افزار براش زياده ...
من قبلا همچين چيزي براي زبان فارسي نوشتم . من يه ايده بهت ميدم روش كار كن ...

شما يه سري صداي بلند داري كه شامل آ - ي - و (آ مثل با ، ي مثل بي ، و مثل بو ) . يه سري صداي كوتاه شامل: َ ِ ُ (مثل مثل صداي ب در كلمه بهرام، مثل صداي صداي ب در كلمه بهشهر، مثل صداي ب در كلمه برنا )
يه ساكن هم داري كه حروف بدون صدا هستند كه تلفظ اونها خيلي سخته و به قولي غير ممكن اما ميتوني نزديك ترين حالت بهشون رو مد نظر قرار بدي.
حالا بايد تركيب كليه حروف الفبا با تك تك اين 7 حالت (3 صداي بلند و 3 صداي كوتاه و يك حالت سكون) رو به صورت ضبط شده داشته باشي. نكته اي كه وجود داره اينه كه لازم نيست براي كليه 32 حرف اين صداها رو ضبط كني ! به خاطر اينكه تلفظ بعضي حروف بسيار به همديگه نزديكه مثل : "غ ق و" يا "ذ ز ض ظ" بنابراين وقتي جمع بزني ميبيني فقط بايد 21 حرف از 32 حرف الفبا رو همراه 7 صدايي كه توضيح دادم ضبط كني. يعني در مجموع ميشه 161 فايل صوتي كه ميتوني به ترتيب از يك تا 161 اونها رو نام گذاري كني.
ليست 21 دسته حروف الفبايي در زير آوردم (حروفي كه در يك خط اومدن يك تلفظ دارند و تكراري محسوب ميشن)
ا ع
ب
پ
ت ط
ث س ص
ج
چ
ح ه
خ
د
ذ ز ض ظ
ر
ژ
ش
غ ق
ف
ک
گ
ل
م
ن
و
ی


حالا ديگه كار راحته، بايد تك تك كاركتر ها رو بخوني. هر حرفي رو كه ميخوني ، از اون 7 حالت خارج نيست ! مثلا فرض كنيم كاركتر اول "ب" باشه ، فقط كافيه كاركتر بعدي اون رو چك كني كه اگر "ا" بود پس بايد فايل حاوي "با" به همين ترتيب براي حالتهاي ديگه ...و اگر كاركتر بعد غير از صداهاي بلند و كوتاه بودند ، صداي سكون يا حالت هفتم كه توضيح دادم بايد پخش بشه ...
به همين ترتيب كل رشته رو توي يه حلقه ميزاري و اين كار رو تكرار ميكني.

من روي اين روش خيلي كار كردم و چندين روز محاسبه و تحقيق كردم تا به اين نتايج زسيدم، اميدوارم تونسته باشم ايده ام رو بتون منتقل كرده باشم .

راستي چرا تو اين انجمن سوالتو مطرح كردي :?:

موفق باشيد
نبي
نقل قول: من قبلا همچين چيزي براي زبان فارسي نوشتم
بابا توکه همه چیز رو قبلا نوشتی خداییش اسمت بیلگیتس نیست :wink:
خوب می دادی بیرون بقیه هم استفاده
و اما بریم سراغ ضرب و تقسیم 21*7=147 یعنی 147 تا فایل صوتی نیاز داریم فرض کن مثل microsoft به خواهیم چند تا صدا هم تولید کنیم مثلا با پیچ کم و زیاد می شه 147*10=1470
فقط برای 10 تا حالت ولی در کل روش خوبیه ولی مشکل اصلی
فرض کن من نوشتم" گل" شما بخون ببینم چی می خونی gol خوندی یا gel مثلا من نوشتم "خواندن" یا نوشتم "خود" این ها رو چی کار کنیم
سلام
نمي دونم شما در چه مقطع تحصيلي هستيد ولي بحث پردازش صدا (كه يكي از شاخه هايش مربوط به سوال شماست) يكي از مباحث تحقيقاتي در سطح دكتري رشته كامپيوتر و الكترونيك است (حالا چرا الكترونيك!)
اگر ميخواهيد از پايه شروع كنيد كه خوب بفرماييد تا چند تا آدرس سايت برايتان بفرستم و اگر هم مي خواهيد از كامپوننت ها استفاده كنيد كه والله من بلد نيستم!
در كل فكر نمي كنم كه اين سوال در سطح ... باشه. به دنبال مباحث دست يافتي برويد . هر چند تحقيق در همه موارد سودمند است.

موفق باشيد
سلام به دوستان

جناب ha_60 اون مشكلي رو كه گفتي تا حدودي قابل كنترل نيست چون زبان ما با زبان انگليسي تفاوت داره . ما يه چيزهايي رو مي نويسيم كه نميخونيم مثل همون صدا ها يا همون واو معدوله مثل خواهر كه شما اشاره كردي!

---- مثلا توي انگليسي هم يه مثال داريم براي اينجور كلمه ها :

كلمه Minute رو همه ميشناسيم البته به معني ( دقيقه ) و تلفظ مي كنيم (مينت) !
اما بايد بگم دقيقا يك تلفط ديگه از همين كلمه بصورت (ماينت) وجود داره به معناي ( ذره ) ! 8O

واسه اين مشكل ؛ مايكروسافت هم فكر نكنم كاري كرده باشه :?

مثلا راه حل : بايد يه چيز فوق العاده هوشمند بنويسي كه معني جمله شما رو بفهمه بعد بطور مناسب تلفظش كنه 8O 8O 8O 8O 8O 8O كه اصلا عملي نيست ! 8O

اگه اين سيستم رو ميشد خيلي دقيق بنا كرد تا حالا ترجمه ماشيني خيلي پيشرفت مي كرد اما اين پيچيدگي زبان ها و غير هوشمند بودن كامپيوتر ها باعث شده تا اين علم تا سطح زيادي محدود بمونه ! :roll:
نقل قول: تحقيقاتي در سطح دكتري رشته كامپيوتر و الكترونيك است (حالا چرا الكترونيك!)
كاشكي الكترونيك بود مربوط به مخابراته 8O 8O (از بسكي اين مخابراتي ها مباحث رياضي دارن هر چي باشه اين كار از طراحي آنتن كه سخت تر نيست Amaze )

نقل قول: در كل فكر نمي كنم كه اين سوال در سطح ... باشه. به دنبال مباحث دست يافتي برويد
در سطح ... هم قابل دسترسي است مخصوصا Text to Speech حتی Speech Recognition رو هم تو سطح لیسانس دیدم کار می کنن و جواب هم گرفتن البته تا حدی

نقل قول: واسه اين مشكل ؛ مايكروسافت هم فكر نكنم كاري كرده باشه
چرا میکروسافت تو برنامه Word معنی جمله رو دقیقا می فهمه 8O و بعضی از کلمات رو از توی جمله تشخیص میده البته برای Speech Recognition

ولی بحث خوبیه ها یه چند نفر پایه پیدا بشید من خیلی تو کفشم البته نوع باکلاسش بی کلاسش زیاده (یه نفر می گفت باید تو مدرسه برام عروسی بگیرین گفتن چرا گفت آخه کلاس داره -حالا تکراری باشه چرا فهش میدین Amaze )
سلام آقا نبي و ها و ...... همه مرسي خيلي ذاهنمايي كرديد
ولي اگه ميشه برام سورس بذاريد
ببخشيد اگه از كسايي كه اسم نبردم تشكر نكردم از اونا هم ممنونم
محمد و .....
Amaze
يه سورس مايكروسافت اجنت هم بذاريد من بينم
:wink:
بابا شرمنده نكن . ما فقط حرافي كرديم و كمكي نبود كه بكنيم . :oops: :oops:

والا من سورسي در اين زمينه ندارم ولي واسه مايكروسافت اجنت اينو ببين :

http://www.iranvig.com/modules.php?name=...le&sid=183

و اينم از دوست قديمي ما مهدي جي :

http://www.iranvig.com/modules.php?name=...le&sid=185

اميدوارم مفيد واقع بشه :wink:
صفحه‌ها: 1 2