2015-03-10 29 views
9

Konwertowałem notatnik IPython na format HTML, a następnie utraciłem oryginalny plik ipynb.IPython notebook: Konwertuj notatnik HTML na ipynb

Czy istnieje prosty sposób na wygenerowanie oryginalnego pliku notatnika z przekonwertowanego pliku HTML?

+0

Czy skopiowanie kodu z pliku html do nowego notatnika nie jest dla ciebie odpowiednią opcją? Sądzę, że jest to dość nietypowy problem i wątpię, czy jest to łatwy sposób. – cel

+3

@cel, tak, jest to opcja, po prostu niezbyt praktyczna w przypadku dużych notebooków. Ale ponieważ plik JSON ipynb i przekonwertowany HTML mają mniej więcej te same informacje, zastanawiałem się, czy dostępny jest konwerter. – foglerit

+0

Nie wierzę, że dostępny jest konwerter z puszkami. –

Odpowiedz

1

Ostatnio użyłem aplikacji BeautifulSoup i JSON do przekonwertowania notatnika html na ipynb. Sztuką jest spojrzenie na schemat JSON notebooka i naśladowanie tego. Kod wybiera komórki tylko kod wejściowy i komórki przecenowych

tutaj jest mój kod

from bs4 import BeautifulSoup 
import json 
import urllib.request 
url = 'http://nbviewer.jupyter.org/url/jakevdp.github.com/downloads/notebooks/XKCD_plots.ipynb' 
response = urllib.request.urlopen(url) 
# for local html file 
# response = open("/Users/note/jupyter/notebook.html") 
text = response.read() 

soup = BeautifulSoup(text, 'lxml') 
# see some of the html 
print(soup.div) 
dictionary = {'nbformat': 4, 'nbformat_minor': 1, 'cells': [], 'metadata': {}} 
for d in soup.findAll("div"): 
    if 'class' in d.attrs.keys(): 
     for clas in d.attrs["class"]: 
      if clas in ["text_cell_render", "input_area"]: 
       # code cell 
       if clas == "input_area": 
        cell = {} 
        cell['metadata'] = {} 
        cell['outputs'] = [] 
        cell['source'] = [d.get_text()] 
        cell['execution_count'] = None 
        cell['cell_type'] = 'code' 
        dictionary['cells'].append(cell) 

       else: 
        cell = {} 
        cell['metadata'] = {} 

        cell['source'] = [d.decode_contents()] 
        cell['cell_type'] = 'markdown' 
        dictionary['cells'].append(cell) 
open('notebook.ipynb', 'w').write(json.dumps(dictionary)) 

tutaj jest częścią print(soup.div) wyjściu

div class="container"> 
<div class="navbar-header"> 
<button class="navbar-toggle collapsed" data-target=".navbar-collapse" data-toggle="collapse" type="button"> 
<span class="sr-only">Toggle navigation</span> 
<i class="fa fa-bars"></i> 
</button> 
<a class="navbar-brand" href="/"> 
<img src="/static/img/nav_logo.svg?v=479cefe8d932fb14a67b93911b97d70f" width="159"/> 
</a> 
</div> 
<div class="collapse navbar-collapse"> 
<ul class="nav navbar-nav navbar-right"> 
<li> 
<a class="active" href="http://jupyter.org">JUPYTER</a> 
</li> 
<li> 
<a href="/faq" title="FAQ"> 
<span>FAQ</span> 

zrzut ekranu z pliku wynikowego ipynb, załadowane na mój local jupyter i po uruchomieniu wszystkich komórek

enter image description here

+2

To świetnie. Dziękuję za udostępnienie. – foglerit