deep-gp/deepImport.lua at master · aciditeam/deep-gp · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
----------------------------------------------------------------------
--
-- Deep Genetic Programming: Reifying an AI researcher.
--
-- Functions for data import
--
----------------------------------------------------------------------

----------------------------------------------------------------------
-- Imports
require 'image'
require 'torch'

----------------------------------------------------------------------
-- Basic import function for SVHN with normalization
function import_data()
  channels = {'y','u','v'};
  -- Sets names
  setFiles = { train='svhn/train_32x32.t7', test='svhn/test_32x32.t7'};
  sets = {};
  -- Load the datasets (factored)
  for key,value in pairs(setFiles) do
      print("    - Loading " .. value);
      -- Load the matalb version
      tmp = torch.load(value, 'ascii');
      -- Transform to row-major
      curData = {
          data = tmp.X:transpose(3,4):float(),
          labels = tmp.y[1],
          mean = {},
          std = {},
          size = function () return (data:size(1)) end
      };
      collectgarbage();
      print("        . Transform to YUV");
      -- Pre-processing data to YUV
      for i = 1,curData.data:size(1) do
          curData.data[i] = image.rgb2yuv(curData.data[i]);
      end
      print("        . Channel-wise normalization");
      -- Channel-wise normalization
      for i,name in ipairs(channels) do
          curData.mean[i] = curData.data[{{}, i, {}, {}}]:mean();
          curData.std[i] = curData.data[{{}, i, {}, {}}]:std();
          curData.data[{{}, i, {}, {}}] = (curData.data[{{}, i, {}, {}}] - curData.mean[i]) / curData.std[i];
      end
      sets[key] = curData;
      collectgarbage();
  end
  ----------------------------------------------------------------------
  -- Data selection (if reduced data option)
  trShuffle = torch.randperm(sets["train"].data:size(1));
  sets["train"].data = sets["train"].data[{{1,trsize},{},{},{}}];
  trShuffle = torch.randperm(sets["test"].data:size(1));
  sets["test"].data = sets["test"].data[{{1,tesize},{},{},{}}];
  ----------------------------------------------------------------------
  -- Data normalization (on Y channel)
  print "    - Contrastive normalization"
  neighborhood = image.gaussian1D(7);
  -- Define the normalization operator (can be inserted inside training model)
  normalization = nn.SpatialContrastiveNormalization(1,neighborhood):float();
  -- Apply this gaussian normalization
  for key,value in pairs(sets) do
      for i = 1, sets[key].data:size(1) do
          sets[key].data[{i, {1}, {}, {}}] = normalization:forward(sets[key].data[{i, {1}, {}, {}}]);
      end
  end
  print "    - Checking data statistics";
  for key,value in pairs(sets) do
    for i,channel in ipairs(channels) do
      meanData = sets[key].data[{ {},i }]:mean();
      stdData = sets[key].data[{ {},i }]:std();
      print('    - '..key..' data, '..channel..'-channel, mean: ' .. meanData .. ', standard deviation: ' .. stdData);
    end
  end
end