شماره اول دوره هفتم

تاريخ انتشار اين مقاله: 2 فروردين 1386

قالب PDF  بازگشت  مجله الكترونيكي صفحه اصلي

فراسوي گوگل: وب پنهان


وب پنهان چيست؟
«وب پنهان» مفهومي است كه براي اطلاعاتي كه بر روي شبكه جهاني وب است، اما با استفاده از موتورهاي جستجوي همه منظوره يافت نمي‌شود.


واقعياتي درباره وب پنهان
● بهترين موتورهاي جستجو فقط قادر به در دسترس قرار دادن حدود 14% اطلاعاتي هستند كه بر روي شبكه جهاني وب قرار داده شده است، بنابراين 86% اطلاعات خارج از دسترس موتورهاي جستجو است.
●  اندازه وب پنهان550 بيليون بزرگتر از وب آشكارظاهر است.
● وب پنهان حاوي حدود 550 بيليون مدرك است، در حاليكه در مقام مقايسه، با وب آشكار يك بيليون صفحه است.
● وب پنهان بزرگترين رشد مقوله اطلاعات جديد را در وب دارد.
● 95% وب پنهان اطلاعات براي همگان قابل دسترسي است(اما از طريق موتورهاي جستجو نمي‌توان به آنها رسيد).
● بيش از نيمي از وب پنهان در پايگاههاي اطلاعاتي معين است.


ويژگيهاي محتوايي وب پنهان: چرا موتورهاي جستجو نمي‌توانند اطلاعات را بيابند
● محتوا در پايگاه اطلاعاتي ذخيره شده است
● پايگاه اطلاعاتي با پرداخت هزينه قابل دسترسي است
● محتوا در زمان واقعي ارائه مي‌شود
● قالبهاي محتوا
● ورود به سايتها، نيازمند اجازه ويژه است
● تعاملي بودن محتوا
● محتوا به عنوان نتيجه كاوش كاربر، بصورت پويا توليد مي‌شود.
● سايتهايي كه توسط پروتكلهاي بازدارنده روبوتها مسدود شده‌اند
● اطلاعاتي كه به تازگي به سايت افزوده شده و موتورهاي جستجو هنوز به آنها دسترسي نيافته‌اند.

 

توسط كاوشگرهاي استاندارد يافت نشده است

نمونه‌ها

محتواي پايگاههاي اطلاعاتي(با درخواست كاوش كاربر، محتوا توليد مي‌شود)

پايگاههايي مانند:

ERIC, PubMed, Library catalogs

قالبهاي محتوا

قالبهاي پي.دي.اف، ديداري و شنيداري و هر قالب جديد ديگر

اطلاعات بلادرنگ(زمان واقعي)

وضعيت آب و هو، قيمت سهام، وضعيت پرواز هواپيماها

دسترسي به خدمات نيازمند پرداخت هزينه است

سايتهاي:

EBSOChost, INFOTRAC, LexisNexis Academic

دسترسي به سايت نيازمند رمز عبور يا ثبت نام است

همه سايتهايي كه نيازمند عضويت هستند

دسترسي به سايت نيازمند پر كردن فرم خاصي است

سايتهاي راهنماي مسافرت، سايتهاي كاريابي

سايتهاي با پروتكل غيرنمايه‌اي (درج تگهايي كه كاوشگرها را از نمايه كردن آنها باز مي‌دارد مانند تگ

<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

سايتهاي خصوصي


 

 

راههاي كه دسترسي به وب پنهان را هموار مي‌كند:

1. راهنماها:

Open Directory Project: www.dmoz.org

بزرگترين راهنماي وب كه ويراستاري آن توسط افراد (غير ماشيني) انجام مي‌گيرد

 

Librarian's Internet Index: www.lii.org

پايگاه اطلاعاتي با حدود 17000 وب سايت با عناوين متنوع.  با ارائه خبرنامه

Infomine: http://infomine.ucr.edu

مجموعه پژوهشهاي اينترنتي دانش‌پژوهان از دانشگاه كاليفرنياي جنوبي

 

Digital Librarian: www.digital-librarian.com

سايت «كتابدار ديجيتالي» مارگارت اندرسون – كتابدار

 

2. مسيريابها

Library and Information Technology Association: http://www.ala.org/ala/lita/litaresources/toolkitforexpert/toolkitexpert.htm

انجمن كتابداري و فناوري اطلاعات

 

A tutorial from the University of California-Berkeley: http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/InvisibleWeb.html

خودآموزي از دانشگاه كاليفرنيا-بركلي
 

Lackie, Robert J. "Those Dark Hiding Places: The Invisible Web Revealed.": http://library.rider.edu/scholarly/rlackie/Invisible/Inv_Web_Main.html

آشكار سازي وب پنهان "آناني كه مخفيگاهها را تاريك مي‌كنند"

 

3. كاوشگرها

BrightPlanet's www.completeplanet.com

¡ www.kartoo.com

 –مناسب براي يافتن فايلهاي قالب پي.دي.اف و گروههاي خبري www.google.com

www.search-22.com

www.freepint.com/gary/direct.htm

http://searchpdf.adobe.com

www.closerlooksearch.com

http://oaister.umdl.umich.edu/o/oaister/دسترسي به مجموعه منابع كتابخانه ديجيتالي

4.پايگاههاي اطلاعاتي خاص

www.findarticles.com - a database of free articles

MagPortal.com - a database of free articles

www.anywho.com - "Finding People, Places, and Businesses"

www.findlaw.com - information on federal and state laws, lawsuits, etc.

http://www.thegateway.org - Gateway to Educational Materials, U.S. Dept. of Education - cataloged collection of educational materials from federal, state, and university web sites.

www.nsdl.org - National Science Digital Library

www.usa.gov

www.gpoaccess.gov

http://catalog.loc.gov - Library of Congress

www.ncbi.nlm.nih.gov/PubMed - free Web version of Medline

www.infousa.com - company database of 12 million records

www.singingfish.com - For audio and video searching

http://www.scienceresearch.com/ - Searches web-based science journals, databases, and websites not accessible through general purpose search engines

www.shadowtv.com

5. چگونه بهنگام باشيم

http://searchenginewatch.com

www.marylaine.com/neatnew.html

www.researchbuzz.com/wp

www.lii.org/search/file/mailinglist/

www.freepint.com/issues/issues.htm - newsletter

Subscription to various listservs, discussion lists is one other way to keep up with the changing Web environment.

www.resourceshelf.com

www.docuticker.com

6. وبلاگها

Deep Web Research - http://deepwebresearch.blogspot.com/
An information Blog created and maintained by Marcus P. Zillman.

Invisible Web Weblog - http://invisibleweblog.blogspot.com/
Maintained by Yazdan Mansourian, a research student at the University of Sheffield, England.


اين مقاله از منبع زير تلخيص شده است:

Jane, Devine & Egger-Sider, Francine. Beyond Google: The Invisible Web

http://www.lagcc.cuny.edu/library/invisibleweb

 


شرايط استفاده  از مقاله

1- انتشار ( چاپي يا الكترونيكي) مقالات بدون اخذ مجوز از ناشر(پژوهشگاه اطلاعات و مدارك علمي ايران) ممنوع است و تخلف از آن موجب پيگرد قانونی خواهد شد.

2- فقط نقل چكيده مقالات در ساير محيطهاي الكترونيكي (مانند سايتهاي اينترنتي) مجاز است که بايد همراه با ذکر نام نويسنده ، نام ناشر و درج نشاني پيوند(لينك) اينترنتي پژوهشگاه باشد.