Whamcloud - gitweb
landing b_cmobd_merge on HEAD
[fs/lustre-release.git] / lustre / liblustre / dir.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * Lustre Light directory handling
5  *
6  *  Copyright (c) 2002, 2003 Cluster File Systems, Inc.
7  *
8  *   This file is part of Lustre, http://www.lustre.org.
9  *
10  *   Lustre is free software; you can redistribute it and/or
11  *   modify it under the terms of version 2 of the GNU General Public
12  *   License as published by the Free Software Foundation.
13  *
14  *   Lustre is distributed in the hope that it will be useful,
15  *   but WITHOUT ANY WARRANTY; without even the implied warranty of
16  *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  *   GNU General Public License for more details.
18  *
19  *   You should have received a copy of the GNU General Public License
20  *   along with Lustre; if not, write to the Free Software
21  *   Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
22  */
23
24 #define DEBUG_SUBSYSTEM S_LLITE
25
26 #include <unistd.h>
27 #include <stdlib.h>
28 #include <string.h>
29 #include <assert.h>
30 #include <time.h>
31 #include <sys/types.h>
32 #include <sys/stat.h>
33 #include <sys/fcntl.h>
34 #include <sys/queue.h>
35
36 #include <sysio.h>
37 #include <fs.h>
38 #include <mount.h>
39 #include <inode.h>
40 #include <file.h>
41
42 #undef LIST_HEAD
43
44 #include <linux/types.h>
45 #include <linux/dirent.h>
46 #include <linux/unistd.h>
47
48 #include "llite_lib.h"
49
50 static int llu_dir_do_readpage(struct inode *inode, struct page *page)
51 {
52         struct llu_inode_info *lli = llu_i2info(inode);
53         struct llu_sb_info *sbi = llu_i2sbi(inode);
54         struct ll_fid mdc_fid;
55         __u64 offset;
56         int rc = 0;
57         struct ptlrpc_request *request;
58         struct lustre_handle lockh;
59         struct mds_body *body;
60         struct lookup_intent it = { .it_op = IT_READDIR };
61         struct mdc_op_data data;
62         struct obd_device *obddev = class_exp2obd(sbi->ll_mdc_exp);
63         struct ldlm_res_id res_id =
64                 { .name = {lli->lli_st_ino, (__u64)lli->lli_st_generation} };
65         ldlm_policy_data_t policy = { .l_inodebits = { MDS_INODELOCK_UPDATE } };
66         ENTRY;
67
68         if ((lli->lli_st_size + PAGE_CACHE_SIZE - 1) >> PAGE_SHIFT <= page->index) {
69                 /* XXX why do we need this exactly, and why do we think that
70                  *     an all-zero directory page is useful?
71                  */
72                 CERROR("memsetting dir page %lu to zero (size %lld)\n",
73                        page->index, lli->lli_st_size);
74                 memset(page->addr, 0, PAGE_CACHE_SIZE);
75                 GOTO(readpage_out, rc);
76         }
77
78         rc = ldlm_lock_match(obddev->obd_namespace, LDLM_FL_BLOCK_GRANTED,
79                              &res_id, LDLM_IBITS, &policy, LCK_PR, &lockh);
80         if (!rc) {
81                 llu_prepare_mdc_op_data(&data, inode, NULL, NULL, 0, 0);
82
83                 rc = mdc_enqueue(sbi->ll_mdc_exp, LDLM_IBITS, &it, LCK_PR,
84                                  &data, &lockh, NULL, 0,
85                                  ldlm_completion_ast, llu_mdc_blocking_ast,
86                                  inode);
87                 request = (struct ptlrpc_request *)it.d.lustre.it_data;
88                 if (request)
89                         ptlrpc_req_finished(request);
90                 if (rc < 0) {
91                         CERROR("lock enqueue: err: %d\n", rc);
92                         RETURN(rc);
93                 }
94         }
95         ldlm_lock_dump_handle(D_OTHER, &lockh);
96
97         mdc_pack_fid(&mdc_fid, lli->lli_st_ino, lli->lli_st_generation, S_IFDIR);
98
99         offset = page->index << PAGE_SHIFT;
100         rc = mdc_readpage(sbi->ll_mdc_exp, &mdc_fid,
101                           offset, page, &request);
102         if (!rc) {
103                 body = lustre_msg_buf(request->rq_repmsg, 0, sizeof (*body));
104                 LASSERT (body != NULL);         /* checked by mdc_readpage() */
105                 LASSERT_REPSWABBED (request, 0); /* swabbed by mdc_readpage() */
106
107                 lli->lli_st_size = body->size;
108         }
109         ptlrpc_req_finished(request);
110         EXIT;
111
112  readpage_out:
113         ldlm_lock_decref(&lockh, LCK_PR);
114         return rc;
115 }
116
117 static struct page *llu_dir_read_page(struct inode *ino, int pgidx)
118 {
119         struct page *page;
120         int rc;
121         ENTRY;
122
123         page = alloc_page(0);
124         if (!page) {
125                 CERROR("alloc page failed\n");
126                 RETURN(ERR_PTR(-ENOMEM));
127         }
128         page->index = pgidx;
129
130         rc = llu_dir_do_readpage(ino, page);
131         if (rc) {
132                 free_page(page);
133                 RETURN(ERR_PTR(rc));
134         }
135
136         return page;
137 }
138
139 #define NAME_OFFSET(de) ((int) ((de)->d_name - (char *) (de)))
140 #define ROUND_UP64(x)   (((x)+sizeof(__u64)-1) & ~(sizeof(__u64)-1))
141
142 static int filldir(char *buf, int buflen,
143                    const char *name, int namelen, loff_t offset,
144                    ino_t ino, unsigned int d_type, int *filled)
145 {
146         struct dirent64 *dirent = (struct dirent64 *) (buf + *filled);
147         int reclen = ROUND_UP64(NAME_OFFSET(dirent) + namelen + 1);
148
149         /* check overflow */
150         if ((*filled + reclen) > buflen)
151                 return 1;
152
153         dirent->d_ino = ino;
154         dirent->d_off = offset,
155         dirent->d_reclen = reclen;
156         dirent->d_type = (unsigned short) d_type;
157         memcpy(dirent->d_name, name, namelen);
158         dirent->d_name[namelen] = 0;
159
160         *filled += reclen;
161
162         return 0;
163 }
164
165 ssize_t llu_iop_getdirentries(struct inode *ino, char *buf, size_t nbytes,
166                               _SYSIO_OFF_T *basep)
167 {
168         struct llu_inode_info *lli = llu_i2info(ino);
169         loff_t pos = *basep, offset;
170         int maxpages, pgidx, filled = 0;
171         ENTRY;
172
173         if (pos == -1)
174                 pos = lli->lli_dir_pos;
175
176         maxpages = lli->lli_st_size >> PAGE_CACHE_SHIFT;
177         pgidx = pos >> PAGE_CACHE_SHIFT;
178         offset = pos & ~PAGE_CACHE_MASK;
179
180         for ( ; pgidx < maxpages ; pgidx++, offset = 0) {
181                 struct page *page;
182                 struct ext2_dirent *de;
183                 char *addr, *limit;
184
185                 page = llu_dir_read_page(ino, pgidx);
186                 if (IS_ERR(page))
187                         continue;
188
189                 /* size might have been updated by mdc_readpage */
190                 maxpages = lli->lli_st_size >> PAGE_CACHE_SHIFT;
191
192                 /* fill in buffer */
193                 addr = page->addr;
194                 limit = addr + PAGE_CACHE_SIZE - EXT2_DIR_REC_LEN(1);
195                 de = (struct ext2_dirent *) (addr + offset);
196
197                 for ( ; (char*) de <= limit; de = ext2_next_entry(de)) {
198                         if (de->inode) {
199                                 int over;
200                                 unsigned char d_type = 0;
201
202                                 /* XXX handle type, etc here */
203
204                                 offset = (char*) de - addr;
205                                 over =  filldir(buf, nbytes, de->name, de->name_len,
206                                                 (pgidx << PAGE_CACHE_SHIFT) | offset,
207                                                 le32_to_cpu(de->inode), d_type, &filled);
208                                 if (over) {
209                                         free_page(page);
210                                         GOTO(done, 0);
211                                 }
212                         }
213                 }
214                 
215                 free_page(page);
216         }
217 done:
218         lli->lli_dir_pos = pgidx << PAGE_CACHE_SHIFT | offset;
219         *basep = lli->lli_dir_pos;
220         RETURN(filled);
221 }