مجموعه مقالات نهمین همایش زبانشناسی ایران (جلد اول)

مجموعه مقالات نهمین همایش زبانشناسی ایران (جلد اول)

قیمت : ۱۵۹,۰۰۰ ریال
چکیده
تشخیص نویسندۀ یک متن با استفاده از روش های آماری، در حوزۀ شناسایی نویسنده، که یکی از مسائل مهم در پردازش زبان طبیعی است قرار می گیرد. در مسئله شناسایی نویسنده عمل انتساب متنی بی نام به نویسنده ای صورت می گیرد. از مسائل مهم در این حوزه انتخاب ویژگی های سبکی متن برای مطالعه آماری آن است. برای این کار لازم است ویژگی هایی انتخاب شود که بتوان به صورت کمی آنها را مورد مطالعه قرار داد. این ویژگی ها می توانند واژگانی، حرفی، نحوی و یا مفهومی باشند. در مرحله دسته بندی اسناد که پس از انتخاب و استخراج ویژگی ها و به منظور شناسایی نویسندۀ متن صورت می گیرد، از روش های مختلفی همچون درخت تصمیم، شبکه عصبی مصنوعی، بیز ساده و روش های دیگر دسته بندی که در حوزه دانش یادگیری ماشین قرار دارند، می توان استفاده کرد. در این پژوهش، به بررسی ویژگی های سبکی آثار چهار شاعر شعر نو )مهدی اخوان ثالث، نیمایوشیج، احمد شاملو و سهراب سپهری( در سه سطح واژگانی، نحوی و حرفی از پیکره ای که متشکل از اشعار این چهار تن است، می پردازیم. در مرحله بعد، با استفاده از دسته بند ماشین بردار پشتیبان به صورت خودکار، عمل دسته بندی و انتساب داده های آزمایش به یکی از چهار شاعر فوق انجام می گیرد. با بررسی نتایج دسته بندی ها در هر سطح، مشخص شد که ویژگی های نحوی از کارآیی بالاتری نسبت به ویژگی های واژگانی و حرفی در دسته بندی برخوردارند. سپس با ادغام کل ویژگی ها و تشکیل برداری با 1153 مولفه، دسته بندی صورت گرفت.
مرتبط با این کتاب

نظرات کاربران
هنوز نظری برای این کتاب ثبت نشده است.