-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathfile.py
More file actions
98 lines (96 loc) · 3.04 KB
/
file.py
File metadata and controls
98 lines (96 loc) · 3.04 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
#!/usr/bin/python3.6
# -*- coding: utf-8 -*-
import subprocess
from sys import argv
import textFct
from fileCls import File, Article
from htmlCls import Html
from fileList import FileTable
import loggerFct as log
help ="""traiter des fichiers
utilisation
le script est appelable dans un fichier
python3 file.py fichier tag (fichierB)
les valeurs de tag
clean (ru - r - u): nettoyer le texte. modifier ou pas la casse.
mef (ru - r - u): mettre en forme un texte utilisant ma mise en forme spécifique.
help: afficher l'aide d'un fichier python.
conv: transformer un fichier html en texte et vice-versa. art pour convertir un article
md: transformer un fichier txt en markdown
comp: comparer deux fichiers
art: transformer un texte simple en article
pdf (img): récupérer le texte d'un pdf
js: transformer un tableau tsv en variable js
"""
nbArg = len (argv)
if nbArg <3: print (help)
elif argv[2] == 'help':
from funcHelp import printHelp
printHelp (argv[1])
elif argv[2] == 'pdf':
page = Article (argv[1])
if argv[1][-4:] == '.pdf' or argv[1][-4:] == '.PDF':
if nbArg >3: page.fromPdf (True)
else: page.fromPdf (False)
if argv[1][-4:] == '.txt': page.fromPdfTxt()
page.write()
elif argv[2] == 'art':
page = File (argv[1])
page.read()
article = Article (argv[1])
article.fromFile()
article.write()
elif argv[2] == 'js':
page = FileTable (argv[1])
page.read()
page.toJslist()
elif argv[2] == 'md':
page = File (argv[1])
page.read()
page.toMarkdown()
page.write()
elif argv[2] == 'conv':
page = None
if argv[1][-4:] == '.txt':
pageHtml = Html()
page = File (argv[1])
page.read()
if '\n\n==\n\nsujet: ' in page.text or '\n\n==\n\nSujet: ' in page.text:
page = Article (argv[1])
page.read()
pageHtml.fromArticle (page)
else: pageHtml.fromText (page)
pageHtml.toEreader() # je ne créé de html que pour mes appareils
elif argv[1][-5:] == '.html':
page = Html (argv[1])
page.read()
page = page.toText()
if page: page.write()
elif nbArg >2 and argv[2] == 'comp':
fileA = File (argv[1])
fileA.read()
fileB = File (argv[3])
fileB.read()
fileA.comparer (fileB)
elif argv[2] == 'mef':
filePerso = File (argv[1])
filePerso.read()
affinement =""
if nbArg >3:
if 'r' in argv[3] and 'u' in argv[3]: affinement = 'reset upper'
elif 'r' in argv[3]: affinement = 'reset'
elif 'u' in argv[3]: affinement = 'upper'
filePerso.text = textFct.shape (filePerso.text, affinement)
filePerso.write()
elif argv[2] == 'clean':
filePerso = File (argv[1])
filePerso.read()
# TODO: à revoir
if filePerso.path[-5:] == '.html' or filePerso.path[-6:] == '.xhtml' or filePerso.path[-4:] == '.xml': filePerso.text = textFct.cleanHtml (filePerso.text)
# formats dérivés du xml
elif filePerso.path[-4:] == '.ops' or filePerso.path[-4:] == '.opf' or filePerso.path[-4:] == '.ncx': filePerso.text = textFct.cleanHtml (filePerso.text)
elif filePerso.path[-4:] == '.css': filePerso.text = textFct.cleanCss (filePerso.text)
else: filePerso.text = textFct.cleanText (filePerso.text)
filePerso.write()
# le nom du fichier n'a pas ete donne
else: print (help)