diff options
author | Andras Elso <[email protected]> | 2013-10-14 13:07:47 +0200 |
---|---|---|
committer | Andras Elso <[email protected]> | 2013-10-14 13:07:47 +0200 |
commit | f9b3d7af471909a449c3bf5977a7aaa6555a3495 (patch) | |
tree | fcfb109d7c8aed693f171f7f114d043f25b9802b /youtube_dl/extractor/sztvhu.py | |
parent | ea62a2da466e3fce802930d3685d53a159520719 (diff) | |
download | youtube-dl-f9b3d7af471909a449c3bf5977a7aaa6555a3495.tar.gz youtube-dl-f9b3d7af471909a449c3bf5977a7aaa6555a3495.zip |
Add an extractor for Szombathelyi TV
Diffstat (limited to 'youtube_dl/extractor/sztvhu.py')
-rw-r--r-- | youtube_dl/extractor/sztvhu.py | 41 |
1 files changed, 41 insertions, 0 deletions
diff --git a/youtube_dl/extractor/sztvhu.py b/youtube_dl/extractor/sztvhu.py new file mode 100644 index 000000000..486f93d26 --- /dev/null +++ b/youtube_dl/extractor/sztvhu.py @@ -0,0 +1,41 @@ +# -*- coding: utf-8 -*- + +import re + +from .common import InfoExtractor +from ..utils import determine_ext + +class SztvHuIE(InfoExtractor): + _VALID_URL = r'(?:http://)?(?:(?:www\.)?sztv\.hu|www\.tvszombathely\.hu)/([^/]+)/(?P<name>.+)' + _TEST = { + u'url': u'http://sztv.hu/hirek/cserkeszek-nepszerusitettek-a-kornyezettudatos-eletmodot-a-savaria-teren-20130909', + u'file': u'130909zoldnap.mp4', + u'md5': u'0047eacedc0afd1ceeac99e69173a07e', + u'info_dict': { + u"title": u"Cserkészek népszerűsítették a környezettudatos életmódot a Savaria téren", + u"description" : u'A zöld nap játékos ismeretterjesztő programjait a Magyar Cserkész Szövetség szervezte, akik az ország nyolc városában adják át tudásukat az érdeklődőknek. A PET...', + } + } + + def _real_extract(self, url): + mobj = re.match(self._VALID_URL, url) + name = mobj.group('name') + webpage = self._download_webpage(url, name) +# file = self._search_regex(r'var fileHtml5 = "...:(.*?)";', + file = self._search_regex(r'file: "...:(.*?)",', + webpage, 'video file') + title = self._html_search_regex(r'<meta name="title" content="([^"]*)"', + webpage, 'video title').rsplit(' - ', 2)[0] + description = self._html_search_regex(r'<meta name="description" content="([^"]*)"/>', + webpage, 'video description') + thumbnail = self._og_search_thumbnail(webpage) + + video_url = 'http://media.sztv.hu/vod/' + file + + return {'id': name, + 'url' : video_url, + 'title': title, + 'ext': determine_ext(video_url), + 'description': description, + 'thumbnail': thumbnail, + } |